Installation de Scrapy sous CentOS
Introduction
Scrapy est un framework open-source de web scrapnig pour Python, s'appuyant sur l'architecture Twisted. Il offre une boîte à outils complète pour le téléchargement et l'extraction de données à partir du web.
Environnement requis
CentOS 5.4
Python 2.7.3
Étapes d'installation
1. Installer Python 2.7.3
Téléchargez et compilez Python ...
Publié le 10 juin à 16h15
Analyse et extraction de données HTML/XML avec Beautiful Soup 4
Introduction à Beautiful Soup 4
Beautiful Soup est une bibliothèque Python largement utilisée pour extraire des informations à partir de fichiers HTML et XML. Bien que la version 3 ait existé par le passé, la version actuelle et recommandée est Beautiful Soup 4 (BS4).
Pour commencer, installez la bibliothèque via pip :
pip install beautifulsoup ...
Publié le 9 juin à 23h03