Web Scraping avec python
Tutoriel : Web Scraping et BeautifulSoup Publié: 29 juin 2017 Pour sourcer des données pour des projets de science des données, vous comptez souvent sur des bases de données SQL et NoSQL , des API ou des ensembles de données CSV prêts à l'emploi. Le problème est que vous ne pouvez pas toujours trouver un ensemble de données sur votre sujet, les bases de données ne sont pas tenues à jour et les API sont chères ou ont des limites d'utilisation. Si les données que vous recherchez se trouvent sur une page Web, la solution à tous ces problèmes est le grattage Web . Dans ce tutoriel, nous allons apprendre à gratter plusieurs pages Web avec Python en utilisant BeautifulSoup et les requêtes . Nous effectuerons ensuite une analyse simple en utilisant pandas et matplotlib . Vous devriez déjà avoir une compréhension de base du HTML, une bonne compréhension des bases de Python et une idée approximative de ce qu'est le grattage Web. Si vous n'êtes pas à l