Catégories
Techjournalisme

Analyse géographique des résultats de la primaire

Grâce au travail de Data Publica, et à la publication de données diverses par le Parti socialiste, n’importe qui dispose aujourd’hui de résultats assez complets sur la primaire socialiste, avec des détails sur les bureaux de vote, tels que géolocalisation, adresse, résultats. Une fois reliés les données entre elles, avec notamment la correspondance entre les deux types d’identifiants de bureaux de vote, pas mal de choses sont possibles.

Ces derniers temps, j’ai lu une analyse de Jérôme Fourquet sur le vote dans le péri-urbain —très favorable au Front National—, la lecture du livre de Christophe Guilluy sur les fracteures en France —notamment entre les centres urbains et banlieues encouragées par la mondialisation, et le péri-urbain et le rural oublié par la mondialisation— ainsi que les articles de Thomas Wieder et Françoise Fressoz sur la « France d’à côté » dans Le Monde, et l’étude de l’Ifop sur la géographie du vote aux primaires.

J’ai donc tenté d’explorer les résultats des différents bureaux de vote à la primaire (BVP) en fonction de leur distances au 41 aires urbaines de plus de 200 000 habitants identifiés dans l’étude de l’Ifop et de voir si le « grand péri-urbain » avait voté différemment lors de cette primaire.

  • Mesurer la distance entre les bureaux de vote et les aires urbaines

Grâce aux longitudes et latitudes des BVP disponibles dans le fichier de recensement, j’ai automatisé la création de colonne pour chacune des aires urbaines dans Google Refine indiquant la distance du BVP avec le centre de l’aire urbaine.

La formule de la distance est celle permettant de calculer la distance à vol d’oiseau entre deux points sur la Terre. Ici, la création de colonne est décrite en json pour être systématisée dans Google Refine.

[
	{
	"op": "core/column-addition",
	"description": "Create column Amiens at index 2 based on
column lat using expression.",
	"engineConfig": {
		"facets": [],
		"mode": "row-based"
	},
	"newColumnName": "Amiens",
	"columnInsertIndex": 2,
	"baseColumnName": "lat",
	"expression":
	"grel:acos(sin(radians(cells['lat'].value))*sin(radians(49.9
))+cos(radians(cells['lat'].value))*cos(radians(49.9))*cos(radians(
2.3-cells['lng'].value)))*6371",
	"onError": "set-to-blank"
	}
]

Une fois les 41 colonnes crées, il faut garder la distance minimum. Comme Google Refine ne permet pas de calculer ceci facilement, j’ai tout versé dans un Google Spreadsheet —mais ça fonctionne aussi avec Excel, que je n’ai pas— et voilà !

  • Normalisation des scores

Les scores sont donnés par nombre de voix pour chaque bureau. Avec une simple requête dans Google Refine, j’ai transformée chaque colonne en un écart en points avec la moyenne nationale. J’ai ensuite fusionné les deux bases de données grâce à Google Refine en mettant en relation les deux colonnes d’identifiants des BVP.

(value/cells["votantsPT"].value-0.3916)*100
  • Comptage par zone géographique

Ne pouvant bénéficier des tableaux croisés dynamiques d’Excel, j’ai utilisé la fonction QUERY de Google Spreadsheet, qui permet d’utiliser chaque ligne d’un tableur comme un champ d’une base de données, et permet donc de connaître la répartition de l’écart aux scores en fonction de la distance du BVP au centre de l’aire urbaine.

=query('Résultats bruts'!$A:$G;"select avg(B), avg(C), avg(D), 
avg(E), avg(F), avg(G) where A <= 10 and A > 20

Le résultat est intéressant à plusieurs titres. Il montre que le vote pour François Hollande est « massif et lissé« , que celui d’Arnaud Montebourg est quasiment similaire, prouvant au passage l’absence de mobilisation des classes populaires pour le candidat de la démondialisation et que Martine Aubry, en revanche « décroche dans le péri-urbain et le rural« .

OhTBE

Cette « (en)quête de données » aurait pu être encore plus complète. Il manque notamment le lien entre les bureaux de vote à la primaire et les bureaux de vote républicains, permettant d’analyser la participation ou de comparer avec d’autres scrutins, au niveau du bureau de vote. De plus, la méthode géographique est légèrement faussé par l’effet d’amitié locale favorise légèrement les territoires ruraux et donc MM. Hollande et Montebourg.

>> voir l’analyse sur Le Monde.fr

Une réponse sur « Analyse géographique des résultats de la primaire »

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.