
إذا كنت تمتلك مدونة على خدمة بلوجر أو أي منصة اخري وتريد استخراج عناوين التدوينات او الصفحات من خلال الروابط فقط، باستخدام لغة البرمجة بايثون، يمكنك القيام بذلك بسهولة باستخدام مكتبة BeautifulSoup. في هذا المقال، سنوضح الخطوات اللازمة لتحقيق ذلك بلغة بسيطة ومفهومة.
تثبيت Python
قبل أن نبدأ، تأكد من تثبيت Python على جهازك. إذا لم يكن لديك بايثون، يمكنك تنزيله وتثبيته من خلال الموقع الرسمي لبايثون، واختيار النسخة المطابقة لنظام التشغيل لديك، حيث أن بايثون متوفر لأنظمة Windows و Linux و macOS ولأنظمة أخري، عبر الرابط التالي.
تثبيت المكتبات المطلوبة
بعد تحميل وتثبيت Python سنحتاج إلى تثبيت مكتبتين رئيسيتين: `requests` لجلب محتوى الويب، و`BeautifulSoup` لتحليل المحتوى واستخراج البيانات. لتثبيت هذه المكتبات، افتح نافذة موجه الأوامر (Command Prompt) أو الطرفية (Terminal) بصلاحيات مدير النظام أو root واكتب الأوامر التالية:
pip install requests
pip install beautifulsoup4
تجهيز - كتابة الكود
افتح محرر نصوص (مثل Notepad أو VS Code) وأنشئ ملفًا جديدًا باسم `get_blog_titles.py`. انسخ الكود التالي وضعه في الملف:
# www.Ghorab.ws ©
import requests
from bs4 import BeautifulSoup
def get_title(blog_url):
response = requests.get(blog_url)
soup = BeautifulSoup(response.text, 'html.parser')
title = soup.find('title').text
return title
# قائمة الروابط
blog_urls = [
"الرابط الأول ",
"الرابط الثاني",
"الرابط الثالث"
]
for url in blog_urls:
print(get_title(url))
تشغيل الكود
بعد حفظ الملف، افتح نافذة موجه الأوامر (Command Prompt) أو الطرفية (Terminal) وانتقل إلى المجلد الذي يحتوي على الملف `get_blog_titles.py` باستخدام الأمر `cd`. على سبيل المثال، إذا كان الملف موجودًا على سطح المكتب، اكتب الأمر التالي:
cd Desktop
ثم، شغل الكود باستخدام الأمر التالي:
python get_blog_titles.py
توضيحات إضافية
هُناك بعض الأمور التي لن تكون واضحة في المقال هُنا، وقد تكون واضحة أكثر في مقطع الفيديو، لعل أبرز تلك الأمور:
- تأكد من تعديل القائمة `blog_urls` بروابط التدوينات الخاصة بك.
- عند تشغيل الكود، سيقوم بجلب عناوين التدوينات وعرضها في نافذة موجه الأوامر مباشرة.
ما الذي يحدث في الكود؟
- استيراد المكتبات: نقوم في البداية باستيراد مكتبات `requests` و`BeautifulSoup` التي نحتاجها.
- تعريف الدالة `get_title`: هذه الدالة تأخذ رابط التدوينة كمدخل، ثم تقوم بجلب محتوى الصفحة وتحليلها لاستخراج العنوان.
- قائمة الروابط: هنا نقوم بتحديد روابط التدوينات أو الصفحات التي نريد استخراج عناوينها.
- تنفيذ الدالة: يقوم الكود بتنفيذ الدالة لكل رابط في القائمة وعرض العنوان الناتج.
بهذا تكون قد نجحت في استخراج عناوين التدوينات أو الصفحات من روابط مدونتك أو أي موقع إلكتروني آخر استنادا علي الرابط فقك وذلك باستخدام بايثون. إذا كان لديك أي استفسار أو واجهت أي مشكلة، لا تتردد في طلب المساعدة.
إرسال تعليق
1. نأمل الحفاظ علي الذوق العام وآراء وتعليقات الغير.
2. تجنب استخدام الكلمات البذيئة وتجنب أسلوب الهجوم والتجريح.
3. تذكر، ما يلفظ من قول إلا لديه رقيب عتيد.
4. يجب الالتزام التام بجميع قوانين سياسة الخصوصية.
5. يمكنك نشر رابط صورة أو فيديو ليتم عرضها في التعليق.