Législatives 2017 : générer une liste des investitures

Certains partis ont plus ou moins bouclé leurs investitures, même si cela risque de bouger encore, avec des députés qui ne se représentent pas ou des évolutions liées à des alliances électorales. Cela n’empêche de faire un beau tableau avec ce qu’on a sous la main.  Pour les partis, la réutilisation des données n’est pas la première de leurs obsessions. Le Parti socialiste (lien), LR (lien), UDI (lien), EE-LV (par mail, en PDF) les ont rendues environ publiques. D’autres partis n’ont pas terminé (ou alors je n’ai pas trouvé) : En Marche, les Insoumis, le PCF et le Front national. Ces investitures permettent de s’exercer au nettoyage de données.

LR : faire une table à partir d’un texte

En copiant et collant le texte proposé sur le site de LR dans l’interface d’Open Refine, on peut commencer à jouer. On divise la colonne en deux colonnes grâce aux deux-points présent sur chaque ligne présentant le candidat investi. On récupère aussi le département grâce au tiret.

Ensuite, on note chaque ligne avec un tiret d’une étoile, pour les supprimer plus facilement ensuite. On copie vers le bas le contenu des deux colonnes, pour rassembler toutes les informations sur une seule ligne.

On supprime les lignes avec des étoiles, on nettoie un peu. On crée une nouvelle colonne avec un identifiant unique de circonscription, et hop ! Un fichier des investitures LR tout beau.

PS : récupérer une table à partir d’un PDF

Pour traiter les investitures du PS, on récupère leur PDF et l’outil Tabula. On verse le PDF, on dessine les contours du tableau sur l’aperçu, on recopie ces contours vers le bas et on ajuste.

Ensuite, on clique sur «Preview & Export Exctracted Data» et pof ! Ça nous donne un fichier prêt à glisser dans Open Refine. On corrige les quelques pétouilles, on rajoute une colonne avec un identifiant de circonscription et voilà ! Un fichier des investitures PS tout joli.

Les investitures écolos sont également en format PDF : ça fonctionne de la même manière. Les investitures UDI sont dans un Gdoc ouvert à tous, on peut télécharger facilement une version csv, la glisser dans Refine et c’est également réglé.

On se retrouve avec quatre fichiers dans Open Refine, un par parti. En utilisant les données mises à disposition par Regards Citoyens, on va pouvoir un peu améliorer le fichier final. On garde par exemple le nom du député sortant (ou des députés en cas de circonscription «ministérielle») et on récupère la date de sa première élection, au cas où. Le résultat est là : lien.

Le document permet ainsi de savoir que pour l’instant 347 députés sortants sont réinvestis par leur parti : 160 députés LR, 160 députés socialistes, 20 députés UDI et 7 députés écolos. Les deux plus anciens députés à se représenter sont Gérard Bapt (PS) et Jean-François Mancel (LR). Leur première élection date de 1978.

Leave a Reply

Your email address will not be published. Required fields are marked *