Ensuite, téléchargez le fichier de code script_p3c3.py de ce dossier, et exécutez-le dans votre éditeur. Prenez le temps de comprendre ce que chaque ligne fait, et n’hésitez pas à regarder les captures vidéo plusieurs fois si besoin.
Attention, l'extraction des titres n'est plus fonctionnelle dans le programme p3c3 suite à un changement du code HTML. Premier problème : Il faut remplacer la balise "a", par la balise "div". Second problème : la commande string n'est pas fonctionnelle car il y a des \n dans le code, le string renvoie donc None. Il faut remplacer les fonctions string par get_text()
Il serait également bienvenue de rajouter une petite explication sur la fonction \n présent dans beaucoup de code HTML qu'il faut supprimer lors de l'extraction web.
Enfin je recommande de modifier la ligne correspondante comme suit : with open("data.csv", "w", newline="") as fichier :
Le fait d'ajouter newline="", permet de supprimer la ligne automatiquement générée par l'écriture sur le fichier csv