شرح مكتبة BeautifulSoup4 في لغة بايثون 22 - Programmer Tech
Python Programming

شرح مكتبة BeautifulSoup4 في لغة بايثون 22

مكتبة BeautifulSoup في بايثون

شرح مكتبة BeautifulSoup4 في لغة بايثون

مكتبة (Beautiful Soup) هي مكتبة تُمكننا من عمل تحليل للبيانات parsing و البيانات المحددة يكون شكلها مُعقًَّد و غير منظّم مثل HTML نعمل لها information gathering و نأخذ البيانات عبر مكتبات urllib أو requests او اي مكتبة و نستخدم مكتبة مثل Beautiful Soup لعمل تنظيم للبيانات أو بمعنى اوضح ندخل للرابط نأخذ البيانات او عمل parsing للبيانات المهمة التي تلزمنا بعملنا.

تثبيت مكتبة Beautiful Soup

لتثبيت مكتبة bs4 نقوم بفتح التيرمنال أو موجه الأوامر و نقوم بكتابة أمر تحميلها

pip install bs4

معنى bs4 هو اختصار للكلمة Beautiful Soup و الرقم 4 هو الإصدار اي version, عند إنتهاء التثبيت سوف يكتب لنا نجاح العملية كما يلي.

Successfully built bs4, Installing collected packages: bs4, Successfully installed bs4-0.0.1

هذا يؤكد لنا نجاح عملية التثبيت بنجاح, المكتبة كبيرة جداً إذا نريد شرحها كاملة سوف تأخذ وقت كبير جداً, لكن سنتحدث عن أهم النقاط بها فقط و كيفية إستخدامها بعملية parser أو إستخراج للبيانات.

 

>>>from bs4 import BeautifulSoup
>>>import requests
>>>url = "https://www.google.com/search?q=programmer-tech"
>>>res = requests.get(url)
>>>soup = BeautifulSoup(res.content,'html.parser')
>>>soup.title
<title>programmer-tech—Google'da Ara</title>

في البداية إستدعينا جزء من مكتبة bs4 و هو Beautiful Soup و بعده إستدعينا مكتبة requests ثم وضعنا رابط موقعنا في متغير كما يظهر في متصفح جوجل اي قيمة الـ q ثم إستخدمنا متغير آخر res و عيننا له requests و قلنا له بالذهاب للموقع المحدد في المتغير URL هكذا اصبح لدينا بيانات HTML مخزنة في requests.

سنحتاج لإستخدام Beautiful Soup ثم وضعنا متغير soup و قيمته طلب بيانات الـ HTML عن طريق res. Content ثم عملنا parser للداتا و بعده إستعرضنا العنوان title و اعطانا إياه.

إذا كتبنا

>>> soup.title.text
“programmer-tech—Google'da Ara”

نلاحظ أنه أخرج لنا البيانات بدون تاج.

تثبيت مكتبة BeautifulSoup

إذا نُريد طباعة الداتا كاملة نكتب soup.prettify().

>>> soup.prettify()

عند الضغط على Enter سيأخذ وقت و يطبع كامل الداتا.

للتعرف أكثر على هذه المكتبة و كيف عمل إستخراج بيانات لموقع ما أو إسم من الشبكة العنكبوتية سأضع لكم رابط كتاب بسيط صغير يشرحها و يشرح عملها بالتفصيل, لتحميل الكتاب اضغط هنا.


اطرق تعليق لنري ما رضاكم علي الدروس التي نقدمها (إن كان هناك مشكلة في الدرس يمكنك التحدث مع فريق الدعم لحل لك المشكلة او طرق تعليق بتلك المشكلة ليتم التفاعل من خلال الزوار الآخرين)

Ahmedkaissar

من مصر من محافظة الجيزة مبرمج ويب و خبير أمن معلومات محب للتقنية و الأمن المعلوماتي مدرب للغات "Python,html, css, php, js, laravel"
زر الذهاب إلى الأعلى