<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>misc.alphoenix.net</title>
	<atom:link href="http://blog.alphoenix.net/feed/" rel="self" type="application/rss+xml" />
	<link>http://blog.alphoenix.net</link>
	<description>a bite in a bit of bytes.</description>
	<lastBuildDate>Sun, 29 Apr 2012 20:25:51 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.2</generator>
		<item>
		<title>Projeter le lecteur</title>
		<link>http://blog.alphoenix.net/2012/04/projeter-le-lecteur/</link>
		<comments>http://blog.alphoenix.net/2012/04/projeter-le-lecteur/#comments</comments>
		<pubDate>Sun, 29 Apr 2012 20:05:08 +0000</pubDate>
		<dc:creator>alphoenix</dc:creator>
				<category><![CDATA[Techjournalisme]]></category>
		<category><![CDATA[data]]></category>
		<category><![CDATA[Internet]]></category>
		<category><![CDATA[journalisme]]></category>

		<guid isPermaLink="false">http://blog.alphoenix.net/?p=1025</guid>
		<description><![CDATA[Internet permet beaucoup de choses : de collecter des données, de les présenter, d&#8217;en tirer de l&#8217;information, mais également de mettre en perspective les informations en fonction du lecteur, pour le placer aux coeur du sujet. Le crowd-sourcing est le premier moyen. En devenant une des sources de l&#8217;information, le lecteur y prend part. Je &#8230;]]></description>
			<content:encoded><![CDATA[<p>Internet permet beaucoup de choses : de collecter des données, de les présenter, d&#8217;en tirer de l&#8217;information, mais également de mettre en perspective les informations en fonction du lecteur, pour le placer aux coeur du sujet.</p>
<p><a href="http://blog.alphoenix.net/wp-content/uploads/2012/04/3778459433_c0e3439847_o.jpeg"><img class="aligncenter size-full wp-image-1031" title="Loupe" src="http://blog.alphoenix.net/wp-content/uploads/2012/04/3778459433_c0e3439847_o.jpeg" alt="" width="750" height="524" /></a></p>
<p><strong>Le crowd-sourcing</strong> est le premier moyen. En devenant une des sources de l&#8217;information, le lecteur y prend part. Je l&#8217;ai expérimenté avec <a href="http://www.lemonde.fr/politique/article/2011/09/13/ces-villes-qui-restreignent-l-acces-a-la-cantine-pour-les-enfants-de-chomeur_1570958_823448.html">la carte des cantines scolaires qui restreignent leur accès aux enfants dont les deux parents ne travaillent pas</a>. L&#8217;article a plutôt bien fonctionné. Le fait qu&#8217;il puisse ajouter son grain de sel mais également le fait qu&#8217;il voit tout de suite <em>&#8220;près de chez lui&#8221;</em>, grâce à la carte, où ça se passe a, je pense, joué.</p>
<p><strong>La carte</strong>, si les données le permettent, projettent le lecteur là où ça l&#8217;intéresse. Qui aurait prêté attention à une liste des emprunts toxiques proposés par Dexia s&#8217;ils n&#8217;avaient été <a href="http://labs.liberation.fr/maps/carte-emprunts-toxiques/">étalés sur une carte par Libération</a> ? De la même manière, <a href="http://www.lemonde.fr/election-presidentielle-2012/visuel/2012/01/23/combien-de-redevables-de-l-isf-dans-votre-ville_1633066_1471069.html">la carte de l&#8217;ISF détaillant le nombre de redevables par commune</a> a beaucoup mieux fonctionné que <a href="http://www.lemonde.fr/election-presidentielle-2012/article/2012/01/23/la-carte-de-l-isf-revele-la-separation-entre-riches-et-pauvres_1629128_1471069.html">l&#8217;article expliquant les disparités géographiques entre riches et pauvres</a>.</p>
<p><a href="http://blog.alphoenix.net/wp-content/uploads/2012/04/Capture-d’écran-2012-04-29-à-22.20.38.png"><img class="aligncenter size-full wp-image-1033" title="ISF" src="http://blog.alphoenix.net/wp-content/uploads/2012/04/Capture-d’écran-2012-04-29-à-22.20.38.png" alt="" width="891" height="560" /></a></p>
<p><strong>Le jeu</strong>, ou la <em>gamification</em>, pour être <em>smart</em>. Je suis convaincu qu&#8217;un des moyens pour expliquer une information parfois complexe, c&#8217;est que ça réponde à la question du lecteur : <em>&#8220;Et pour moi, qu&#8217;est-ce que ça change ?&#8221; </em>Par exemple, concernant ces histoires de tranche marginale des impôts à 75% au delà d&#8217;un million d&#8217;euro par an, la proposition lancée par François Hollande à TF1, une des solutions était de l&#8217;écrire tel que. Une autre solution, pas forcément meilleure, mais complémentaire est de proposer <a href="http://www.lemonde.fr/politique/article/2012/03/05/testez-la-reforme-fiscale-de-francois-hollande_1651778_823448.html">une <em>&#8220;calculatrice&#8221;</em></a>. Combien paieriez-vous d&#8217;impôt avec la nouvelle réforme ? Cela répond en partie à la question.</p>
<p><a href="http://blog.alphoenix.net/wp-content/uploads/2012/04/Capture-d’écran-2012-04-29-à-22.03.54.png"><img class="aligncenter size-full wp-image-1027" title="Simulez les reports de voix" src="http://blog.alphoenix.net/wp-content/uploads/2012/04/Capture-d’écran-2012-04-29-à-22.03.54.png" alt="" width="656" height="408" /></a>Un autre exemple avec le report de voix. Tous les commentateurs parlent de celui-là, en faisant la clé du second tour d&#8217;un scrutin. En plus des sondages existant, <a href="http://www.lemonde.fr/election-presidentielle-2012/article/2012/04/23/simulez-le-report-de-voix-au-second-tour_1689349_1471069.html">quoi de mieux que de laisser le lecteur se faire son idée</a> ? Quels reports doit-il y avoir pour déjouer les pronostics et assurer la réélection de Nicolas Sarkozy ? On découvre ainsi que Nicolas Sarkozy pourrait gagner en récupérant une immense majorité des voix de Marine Le Pen, expliquant le tournant droitier de son second tour.</p>
<p>Projection donc au coeur des informations. Et parce que parfois, il y en a peut-être trop, j&#8217;essaie d&#8217;appliquer les conseils <a href="http://infosthetics.com/archives/2011/12/amanda_cox_talks_about_developing_infographics_at_the_new_york_times_graphics.html#extended">d&#8217;Amanda Cox, responsable du département graphique au New York Times</a>. Elle explique que face à la complexité, il faut donner un point d&#8217;entrée aux lecteurs.</p>
<p>Dans la carte de l&#8217;ISF, il s&#8217;agit des villes que l&#8217;on peut remarquer. La Courneuve, qui accueille 53 redevables, ou Croix, qui est la ville en comptant le plus, hébergeant notamment la famille Mulliez, propriétaires du groupe Auchan. À côté du simulateur de réforme fiscale, le calcul peut être fait avec les revenus d&#8217;un smicards, d&#8217;un &#8220;français moyen&#8221; ou d&#8217;un footballeur. Et concernant les reports de voix, il était normal de pouvoir se faire une idée, avec les reports mesurés par BVA, ou ceux de 2007, quand Nicolas Sarkozy bénéficiait d&#8217;une dynamique de premier tour plus importante.</p>
<hr />
<p>photo <a href="http://www.flickr.com/photos/jduty/3778459433/">flickr cc joe duty</a></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.alphoenix.net/2012/04/projeter-le-lecteur/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Étaler Ameli sur une carte</title>
		<link>http://blog.alphoenix.net/2012/04/etaler-ameli-sur-une-carte/</link>
		<comments>http://blog.alphoenix.net/2012/04/etaler-ameli-sur-une-carte/#comments</comments>
		<pubDate>Tue, 10 Apr 2012 13:17:28 +0000</pubDate>
		<dc:creator>alphoenix</dc:creator>
				<category><![CDATA[Techjournalisme]]></category>
		<category><![CDATA[ameli]]></category>
		<category><![CDATA[ameli-direct]]></category>
		<category><![CDATA[ddj]]></category>
		<category><![CDATA[dépassement d'honoraire]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[santé]]></category>
		<category><![CDATA[sécu]]></category>

		<guid isPermaLink="false">http://blog.alphoenix.net/?p=995</guid>
		<description><![CDATA[Après avoir récupéré les données de tous les médecins sur Ameli, il est venu le temps de les mettre sur une carte, pour analyser leur répartition géographique. Pour chaque médecin, nous disposions d&#8217;une adresse postale. Grâce à Yahoo! PlaceFinder, celle-ci était, après un brin de ménage, instantanément transformée en coordonnées géographiques. Fort de ces données, &#8230;]]></description>
			<content:encoded><![CDATA[<p><a href="http://blog.alphoenix.net/2012/04/aspirer-les-medecins-dameli">Après avoir récupéré les données de tous les médecins sur Ameli</a>, il est venu le temps de les mettre sur une carte, pour analyser leur répartition géographique. Pour chaque médecin, nous disposions d&#8217;une adresse postale. Grâce <a href="http://developer.yahoo.com/geo/placefinder/">à Yahoo! PlaceFinder</a>, celle-ci était, après un brin de ménage, instantanément transformée en coordonnées géographiques.</p>
<p>Fort de ces données, géocodées, il était plus facile de les placer sur une carte. Grâce <a href="http://www.openstreetmap.org/">aux données d&#8217;Open Street Map</a> (rue, frontières, fleuves&#8230;), on peut déjà se faire une idée de l&#8217;endroit où sont les médecins.</p>
<p><img class="aligncenter size-full wp-image-1011" title="Médecins à Paris" src="http://blog.alphoenix.net/wp-content/uploads/2012/04/honoraires.png" alt="" width="500" height="393" /></p>
<p>La taille des cercles depend ici du rapport entre tarif pratiqué et tarif de base. Il éclaire la séparation est-ouest, confirmant que les dépassements d&#8217;honoraire sont les plus nombreux là où le niveau de vie est le plus important.</p>
<p>En revanche, il ne met pas assez en valeur le fait que c&#8217;est surtout dans les hôpitaux que pratiquent les professionnels hospitaliers demandant les montants les plus importants. J&#8217;ai donc utilisé <a href="http://www.qgis.org/">QGis, un système d&#8217;information géographique sous licence libre</a>, pour trouver un meilleur moyen de le représenter. L&#8217;outil d&#8217;interpolation a été choisi. Il calcule pour une grille de 300 x 300 pixels la moyenne du rapport &#8220;tarif pratiqué / base de remboursement&#8221; en tenant compte des points alentours.</p>
<p>Cette carte, appelée &#8220;heat map&#8221;, permet de montrer beaucoup plus d&#8217;éléments. Si elle paraît globalement bleu sombre, elle &#8220;illumine&#8221; en rouge les différents hopitaux et quelques cliniques privées. Reste à <a href="http://www.lemonde.fr/sante/article/2012/04/10/enquete-sur-ces-consultations-au-prix-fort_1682940_1651302.html">finaliser le travail pour présenter un début d&#8217;analyse</a>.</p>
<p><img class="aligncenter size-full wp-image-1010" title="medecins" src="http://blog.alphoenix.net/wp-content/uploads/2012/04/medecins.png" alt="" width="960" height="643" /></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.alphoenix.net/2012/04/etaler-ameli-sur-une-carte/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Aspirer les médecins d&#8217;Ameli</title>
		<link>http://blog.alphoenix.net/2012/04/aspirer-les-medecins-dameli/</link>
		<comments>http://blog.alphoenix.net/2012/04/aspirer-les-medecins-dameli/#comments</comments>
		<pubDate>Tue, 10 Apr 2012 13:00:17 +0000</pubDate>
		<dc:creator>alphoenix</dc:creator>
				<category><![CDATA[Techjournalisme]]></category>
		<category><![CDATA[ameli]]></category>
		<category><![CDATA[ameli-direct]]></category>
		<category><![CDATA[ddj]]></category>
		<category><![CDATA[dépassement d'honoraire]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[santé]]></category>
		<category><![CDATA[sécu]]></category>

		<guid isPermaLink="false">http://blog.alphoenix.net/?p=958</guid>
		<description><![CDATA[L&#8217;information, à partir du moment où elle est disponible sur un site Internet est —plus ou moins— facilement copiable et récupérable&#8230; Prenons par exemple le cas de l&#8217;Assurance maladie. Elle propose sur son site un service prénommé Ameli-direct qui permet, et c&#8217;est louable, de trouver près de chez soi, des médecins spécialistes ou généralistes et &#8230;]]></description>
			<content:encoded><![CDATA[<p>L&#8217;information, à partir du moment où elle est disponible sur un site Internet est —plus ou moins— facilement copiable et récupérable&#8230; Prenons par exemple le cas de l&#8217;Assurance maladie. Elle propose sur son site un service prénommé Ameli-direct qui permet, et c&#8217;est louable, de trouver près de chez soi, des médecins spécialistes ou généralistes et surtout de connaître des informations basiques à leur propos : tarifs pratiqués, secteur conventionnel, prise en charge de la Carte vitale&#8230;</p>
<p>L&#8217;Assurance-maladie (Cnam) fournit des informations sur les soins de manière assez simple il faut le dire. Inscrire le nom, le département ou la spécialité et lancer la recherche. Mais elle ne propose pas une liste des médecins de son département, pour trouver le moins cher et le plus proche, par exemple. Bref, aucune version compilée des données n&#8217;est à disposition. En février, <a href="http://www.liberation.fr/depeches/01012392273-depassements-d-honoraires-bertrand-demande-a-la-cnam-et-au-conseil-de-l-ordre-d-intervenir">Xavier Bertrand a demandé à la Cnam et au Conseil de l&#8217;ordre des médecins d&#8217;intervenir sur la question des dépassements d&#8217;honoraire</a>. Il est donc légitime de se poser la question de ces honoraires. Et Ameli-direct fournit le détail, ou presque. Car  la liste complète n&#8217;est pas publique, ni celle <a href="http://www.60millions-mag.com/actualites/archives/des_depassements_d_honoraires_indecents_a_l_hopital_public">des quelques 250 professionnels susceptibles d’être déférés devant le conseil de l’ordre des médecins pour dépassements excessifs d’honoraires</a>, que la Cnam et l&#8217;Ordre ne peuvent pas communiquer.</p>
<p>Il s&#8217;agit donc, <a href="http://www.lemonde.fr/sante/article/2012/04/10/enquete-sur-ces-consultations-au-prix-fort_1682940_1651302.html">pour s&#8217;en faire une idée</a>, de récupérer sur Ameli-direct les informations disponibles à tous. De manière automatisée pour gagner un peu de temps et ne pas relever un à un les noms et les honoraires pratiqués. Rien d&#8217;illégal, les informations sont disponibles sur le site. Hélas, le site ne permet pas d&#8217;afficher le nom de tous les médecins. Il faut donc identifier comment s&#8217;affichent les résultats d&#8217;une recherche, comment se construit une &#8220;page médecin&#8221; et établir un &#8220;protocole&#8221;.</p>
<h2>Le protocole de récupération</h2>
<p>Pour trouver son chemin dans la foule de données, nous avons décidé de ne se concentrer que <a href="http://www.lemonde.fr/sante/article/2012/04/10/comment-le-monde-a-aspire-le-site-ameli-direct_1683004_1651302.html">sur les médecins listés pratiquant une consultation</a>. Lorsque l&#8217;on tape &#8220;consultation&#8221; puis recherche dans l&#8217;espace de recherche de Ameli-direct, une bulle affiche :</p>
<blockquote><p>Plus de 500 résultats : veuillez préciser votre recherche.</p></blockquote>
<p>Étant donné que le site est en Flash, il est possible qu&#8217;il accède aux données par le biais d&#8217;un fichier xml. Pour l&#8217;identifier, nous avons essayé utiliser les &#8220;Outils de développement&#8221; de Chrome ou IE ou <a href="https://addons.mozilla.org/fr/firefox/addon/firebug/">Firebug dans Firefox</a>. Cet outil se penche sur les transferts de fichiers, les scripts tournant en tâche de fond et autres. Que dit-il d&#8217;Ameli-direct lors d&#8217;une recherche ?</p>
<p><img class="aligncenter size-full wp-image-961" title="Network" src="http://blog.alphoenix.net/wp-content/uploads/2012/03/network.png" alt="" width="1004" height="357" /></p>
<p>Le premier fichier à se charger est un fichier nommé &#8220;recherche.html&#8221;. Pas de xml donc. Un fichier html en tâche de fond qui effectue la recherche et renvoie les résultats, ou le fait qu&#8217;il y en a trop. Comment fonctionne-t-il ? En cliquant sur le fichier, penchons nous sur les détails.</p>
<p><img class="aligncenter size-full wp-image-964" title="Recherche" src="http://blog.alphoenix.net/wp-content/uploads/2012/03/recherche1.png" alt="" width="843" height="354" /></p>
<p>Le fichier utilise des cookies —<em>listés après &#8220;Cookie&#8221;</em>— et envoie des données grâce à des paramètres —<em>listés dans la partie &#8220;Form data&#8221;</em>—. Il faut donc construire un fichier qui va aller toquer à la porte de recherche.html avec les cookies et les données correctes. J&#8217;ai choisi pour ce faire d&#8217;utiliser <a href="http://php.net/manual/fr/book.curl.php">cURL en php</a>. En pensant à mettre un user agent —<em>les informations détaillant le navigateur accédant au fichier</em>— qui corresponde à un navigateur traditionnel, au cas où cela soit vérifié. En pensant à créer les cookies dans un fichier. En précisant les bons critères. Tout ça, en partie grâce aux bons conseils <a href="http://twitter.com/nicolaskb">de nkb</a>.</p>
<p>Une fois fait, la méthode donne une page avec 10 résultats, il faut relancer la méthode en ajoutant <em>results_per_page=0</em> pour afficher tous les résultats dans un seul fichier html. Ensuite, en filtrant avec des expressions régulières, on peut récupérer : l&#8217;url de la fiche-médecin, le nom, le secteur et l&#8217;adresse. Nous avons versé tout ça à la base de données en triant par département. Au cas où le département héberge plus de 500 médecins, nous avons filtré les hommes, puis les femmes. Enfin, s&#8217;il y avait toujours trop de médecins, le filtre a été fait par code postal.</p>
<p>Avec l&#8217;url de la fiche médecin, on tombe sur le prix pratiqué pour la consultation, ainsi que le prix de base remboursé par la Sécu. Cela est également versé dans la base, à une vitesse approximative de une fiche-médecin à la seconde, sachant qu&#8217;il y en a plus de 5 000 à Paris. Soyons à ce titre heureux qu&#8217;il n&#8217;y ait à ce jour aucune limitation de l&#8217;adresse IP par le service Ameli-direct !</p>
<p><em>&gt;&gt; à suivre, <a href="http://blog.alphoenix.net/2012/04/etaler-ameli-sur-une-carte/ ">la représentation de ces données</a></em></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.alphoenix.net/2012/04/aspirer-les-medecins-dameli/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>[la question] CSA et temps de parole</title>
		<link>http://blog.alphoenix.net/2012/03/la-question-csa-et-temps-de-parole/</link>
		<comments>http://blog.alphoenix.net/2012/03/la-question-csa-et-temps-de-parole/#comments</comments>
		<pubDate>Fri, 16 Mar 2012 13:42:49 +0000</pubDate>
		<dc:creator>alphoenix</dc:creator>
				<category><![CDATA[Techjournalisme]]></category>
		<category><![CDATA[CSA]]></category>
		<category><![CDATA[opendata]]></category>

		<guid isPermaLink="false">http://blog.alphoenix.net/?p=978</guid>
		<description><![CDATA[Régulièrement, nous allons nous poser des questions autour des problématiques d&#8217;opendata. La question du jour est prête ! Le Conseil supérieur de l&#8217;audiovisuel mérite-t-il d&#8217;être traité de &#8220;naze&#8220; parce qu&#8217;il publie ses décomptes de temps de parole au format PDF ? Le CSA a &#8220;fait l&#8217;effort de la transparence&#8221; selon un responsable de sa communication &#8230;]]></description>
			<content:encoded><![CDATA[<p><em>Régulièrement, nous allons nous poser des questions autour des problématiques d&#8217;opendata. La question du jour est prête !</em></p>
<ul>
<li><strong>Le Conseil supérieur de l&#8217;audiovisuel mérite-t-il d&#8217;être traité de <em>&#8220;<a href="https://twitter.com/#!/alphoenix/status/180286406374064129">naze</a>&#8220;</em> parce qu&#8217;il publie ses décomptes de temps de parole au format PDF ?</strong></li>
</ul>
<p>Le CSA a <em>&#8220;fait l&#8217;effort de la transparence&#8221;</em> selon un responsable de sa communication <a href="http://www.csa.fr/content/view/full/57266">en publiant les décomptes en ligne.</a> Mais ce n&#8217;est pas sa <em>&#8220;politique&#8221;</em> que de proposer des versions &#8220;Excel&#8221; de ces informations. Obligeant les personnes voulant rendre compte de leurs calculs à recopier à la main, au risque de l&#8217;erreur, tous les éléments. Risquant donc que de fausses informations soient publiés en sourçant le CSA. On passe sur le fait que les listes de candidats ne sont pas les mêmes d&#8217;un fichier à l&#8217;autre, ni classées dans le même ordre.</p>
<p><a href="http://www.lexpress.fr/actualite/politique/les-temps-de-parole-des-candidats-a-la-presidentielle_1089052.html"><img class="aligncenter size-full wp-image-983" title="L'Express et le temps de parole" src="http://blog.alphoenix.net/wp-content/uploads/2012/03/Capture-d’écran-2012-03-16-à-14.37.12.png" alt="" width="983" height="511" /></a></p>
<p><a href="http://www.lemonde.fr/election-presidentielle-2012/article/2012/03/15/pour-le-csa-hollande-et-sarkozy-prennent-trop-de-place-a-la-television_1669802_1471069.html">Pour réaliser deux graphiques montrant la répartition totale du temps de parole des candidats et la répartition par chaîne</a>, j&#8217;ai donc perdu deux heures de ma journée à simplement pointer et recopier des durées d&#8217;un <em>PDF</em> —sûrement produit à partir d&#8217;un fichier Excel—. Et <a href="http://abonnes.lemonde.fr/election-presidentielle-2012/article/2012/03/15/pour-le-csa-hollande-et-sarkozy-prennent-trop-de-place-a-la-television_1669802_1471069.html">d&#8217;autres font de même —de manière un peu plus sexy—</a>.</p>
<p>Donc le Conseil supérieur de l&#8217;audiovisuel pourrait publier des informations dans un meilleur format pour encourager leur utilisation. Le responsable de la communication du Conseil supérieur de l&#8217;audiovisuel pourrait y voir son intérêt puisque plus les données sont accessibles et réutilisables, plus elles peuvent l&#8217;être, plus les gens communiquent sur le Conseil supérieur de l&#8217;audiovisuel.</p>
<p>Le Conseil supérieur de l&#8217;audiovisuel, financé par l&#8217;État, rend public le fruit de ses travaux. Cependant, l&#8217;information n&#8217;acquiert de la valeur que lorsqu&#8217;elle peut-être (facilement) réutilisée. Et la transparence n&#8217;est établie que si les informations peuvent être valorisées et comparées.</p>
<p>Mais on ne peut pas les appeler <em>&#8220;nazes&#8221;</em> en revanche, parce que c&#8217;est manquer de respect, et c&#8217;est pas très gentil. Qu&#8217;il m&#8217;en excuse.</p>
<p><em>Voilà ! J&#8217;espère que vous avez une réponse à la question !</em></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.alphoenix.net/2012/03/la-question-csa-et-temps-de-parole/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Le cétacé qui doit faire gagner Barack Obama</title>
		<link>http://blog.alphoenix.net/2012/02/le-cetace-qui-doit-faire-gagner-barack-obama/</link>
		<comments>http://blog.alphoenix.net/2012/02/le-cetace-qui-doit-faire-gagner-barack-obama/#comments</comments>
		<pubDate>Sat, 18 Feb 2012 09:40:28 +0000</pubDate>
		<dc:creator>alphoenix</dc:creator>
				<category><![CDATA[Compol]]></category>
		<category><![CDATA[communication]]></category>
		<category><![CDATA[états-unis]]></category>
		<category><![CDATA[Internet]]></category>
		<category><![CDATA[politique]]></category>

		<guid isPermaLink="false">http://blog.alphoenix.net/?p=935</guid>
		<description><![CDATA[Alors qu&#8217;en France, l&#8217;équipe de François Hollande commence à peine à rendre intelligente sa base de données de contacts, l&#8217;équipe de Barack Obama dévoile les premiers contours de son arme de guerre : Narwhal. Pour sa campagne, le candidat socialiste a décidé de systématiser de nombreuses actions, notamment le porte-à-porte et d&#8217;encourager des soutiens à &#8230;]]></description>
			<content:encoded><![CDATA[<p>Alors qu&#8217;en France, l&#8217;équipe de François Hollande commence à peine à rendre intelligente sa base de données de contacts, l&#8217;équipe de Barack Obama dévoile les premiers contours de son arme de guerre : Narwhal.</p>
<p><a href="http://blog.alphoenix.net/wp-content/uploads/2012/02/Narwhals_breach.jpeg"><img class="aligncenter size-full wp-image-936" title="Narval" src="http://blog.alphoenix.net/wp-content/uploads/2012/02/Narwhals_breach.jpeg" alt="" width="1083" height="642" /></a></p>
<p>Pour sa campagne, le candidat socialiste a décidé de systématiser de nombreuses actions, notamment le porte-à-porte et d&#8217;encourager des soutiens à prendre part à la campagne. <em>&#8220;Les gens viennent si on leur propose une action précise dans un endroit précis&#8221;</em> <a href="http://www.lemonde.fr/election-presidentielle-2012/article/2012/02/02/comment-l-equipe-hollande-veut-mobiliser-via-internet_1633480_1471069.html">explique Claire Heuzé qui s&#8217;occupe de la mobilisation dans la campagne de Hollande</a>. Et un des meilleurs moyens d&#8217;envoyer des actions correspondant aux attentes est de cibler les destinataires. Pour l&#8217;instant et jusqu&#8217;à nouvel ordre, dans la campagne socialiste, le seul ciblage que s&#8217;autorisera l&#8217;équipe c&#8217;est leur lieu de vote, ainsi que leur niveau d&#8217;engagement.</p>
<p>Avec la loi américaine, un peu plus clémente avec la manipulation de bases de données personnelles, l&#8217;exercice peut-être beaucoup plus intéressant. Jim Messina, le directeur de campagne de Barack Obama, <a href="http://www.thedailybeast.com/newsweek/2012/01/01/inside-president-obama-s-reelection-machine.html">explique à Newsweek</a> que son principal avantage sur les républicains cette année, c&#8217;est le temps. Aucune primaire à gagner en comparaison avec les 13 débats télévisés du candidat républicain, qui n&#8217;est toujours pas choisi. Tout le temps donc de mobiliser des troupes qu&#8217;ils connaissent depuis l&#8217;élection de 2008.</p>
<h2>La base de données Narwhal</h2>
<p>L&#8217;équipe de Barack Obama met actuellement au point une immense base de données dénommée Narwhal, qui est la fusion de toutes les bases exploitées depuis lors, avec une mise à disposition facilitée. Ainsi, chaque élément connu sur un électeur en particulier sera accessible à n&#8217;importe quel membre de l&#8217;équipe de campagne. Le volontaire, l&#8217;activiste en ligne, le donateur, l&#8217;électeur, tous les profils seront réunis au même endroit, charriant avec eux leur foule de détails personnels.</p>
<p>Que ce soit le fichier des donateurs, celui des soutiens en ligne, géré par Blue State Digital ou encore les données sociologiques recueillies par le parti démocrate, les données étaient pendant la campagne de 2008 rassemblées dans des espaces différents et chacun était réticent à partager ses informations avec les autres.</p>
<p>La réelle innovation ne sera pas visible et la campagne de 2012 ressemblera beaucoup à celle de 2008 pour les sympathisants <a href="http://www.slate.com/articles/news_and_politics/victory_lab/2012/02/project_narwhal_how_a_top_secret_obama_campaign_program_could_change_the_2012_race_.single.html">selon Slate.com</a>. Mais les outils déployés en coulisses pour suivre les militants, sympathisants et soutiens occasionnels seront beaucoup plus précis et étendu. En lien avec Twitter et Facebook, qui n&#8217;étaient pas si développés, ou tenant compte du smartphone, beaucoup plus utilisé qu&#8217;en 2008. Désormais les sympathisants pourront se connecter sur le site avec leur compte Facebook, pour effectuer des tâches simple, en ligne ou hors ligne, et le site sera bien pensé pour n&#8217;importe quelle plateforme, de la tablette à l&#8217;écran. La connexion grâce à Facebook permettra à la volée de récupérer toutes les données personnelles présentes sur le réseau social <a href="http://www.guardian.co.uk/world/2012/feb/17/obama-digital-data-machine-facebook-election">détaille le Guardian</a>.</p>
<p><img class="size-full wp-image-942" title="Obama on Google+" src="http://blog.alphoenix.net/wp-content/uploads/2012/02/6792552077_d76ebbc7c6_b.jpeg" alt="" width="1024" height="683" /></p>
<p>Et dans les serveurs de l&#8217;équipe d&#8217;Obama, une machine intelligente, ce fameux narval, pistera le plus d&#8217;électeurs et de soutiens possible. Si une personne a donné 5 dollars à un meeting, elle ne recevra pas les mêmes sollicitations que si elle a donné 5$ pendant un débat des candidats républicains. Si une personne a dépassé le plafond de dons personnels, elle ne recevra plus d&#8217;emails d&#8217;appel à dons mais plutôt ceux de mobilisation. Si elle est déjà volontaire pour Obama, personne ne viendra taper à sa porte ou ne lui enverra de tract. Si elle est concernée par les questions de contraception, elle recevra un e-mail sur la position progressiste de Barack Obama sur le sujet.</p>
<p>Ajoutez à cela des statistiques sur leur comportement d&#8217;électeurs en fonction de leur lieu de résidence, leur vote déclaré ou pleins d&#8217;autres informations, et on voit se profiler le génial outil. N&#8217;importe quel électeur ou abstentionniste potentiellement démocrate a sa ligne dans une base de données, permettant de lui adresser les messages qui lui correspondent, et qui correspondent à ses préoccupations. <a href="http://www.chicagomag.com/Chicago-Magazine/The-312/February-2012/What-Does-the-Obama-Campaign-Know-About-You/">Le Chicago Magazine se pose la question</a> de savoir ce qu&#8217;Obama sait vraiment de ses électeurs, illustrant avec un immense HAL 9000 aux couleurs du président.</p>
<p>De quoi s&#8217;interroger sur limites du marketing dans la démocratie et dans le libre-arbitre au moment du vote, lorsque les seuls messages que l&#8217;on reçoit sont ceux avec lesquels on est d&#8217;accord.</p>
<hr />
<p>illustrations : <a href="http://fr.wikipedia.org/wiki/Fichier:Narwhals_breach.jpg">NIST</a> &#8211; <a href="http://www.flickr.com/photos/whitehouse/6792552077/sizes/l/in/photostream/">White House</a></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.alphoenix.net/2012/02/le-cetace-qui-doit-faire-gagner-barack-obama/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Le Posteur a trépassé</title>
		<link>http://blog.alphoenix.net/2012/01/le-posteur-a-trepasse/</link>
		<comments>http://blog.alphoenix.net/2012/01/le-posteur-a-trepasse/#comments</comments>
		<pubDate>Fri, 20 Jan 2012 16:25:46 +0000</pubDate>
		<dc:creator>alphoenix</dc:creator>
				<category><![CDATA[Folklore]]></category>
		<category><![CDATA[Internet]]></category>
		<category><![CDATA[journalisme]]></category>
		<category><![CDATA[le post]]></category>

		<guid isPermaLink="false">http://blog.alphoenix.net/?p=921</guid>
		<description><![CDATA[En 2009, Le Post, c&#8217;était un peu comme Twitter aujourd&#8217;hui, maintenant qu&#8217;il y a beaucoup d&#8217;utilisateurs. Quand on voulait savoir &#8220;ce qui se passait sur le net&#8221;, on jetait un coup d&#8217;oeil à la une. Guy Birenbaum, qui a été impliqué dans le lancement du site avant même son ouverture raconte que &#8220;c&#8217;était sur Le &#8230;]]></description>
			<content:encoded><![CDATA[<p><a href="http://blog.alphoenix.net/wp-content/uploads/2012/01/h-4-2669914-1326997213.jpeg"><img class="aligncenter size-full wp-image-928" title="Le Post" src="http://blog.alphoenix.net/wp-content/uploads/2012/01/h-4-2669914-1326997213.jpeg" alt="" width="575" height="385" /></a></p>
<p>En 2009, Le Post, c&#8217;était un peu comme Twitter aujourd&#8217;hui, maintenant qu&#8217;il y a beaucoup d&#8217;utilisateurs. Quand on voulait savoir <em>&#8220;ce qui se passait sur le net&#8221;</em>, on jetait un coup d&#8217;oeil à la une. Guy Birenbaum, qui a été impliqué dans le lancement du site avant même son ouverture raconte que <em>&#8220;c&#8217;était sur Le Post qu&#8217;il fallait aller pour voir les choses&#8221;</em>.</p>
<p>C&#8217;est là qu&#8217;étaient les vidéos qu&#8217;il fallait retenir de la journée télévisée de la veille. C&#8217;est là que commentaient les polémistes, qu&#8217;ils soient bons ou mauvais. C&#8217;est là que survivait une grosse communauté de royalistes Désirs d&#8217;Avenir après sa défaite. C&#8217;est là aussi que des plaisantins avaient organisé la mort de Jean Dujardin. Il y avait à boire et à manger comme on dit, entre les infos les plus insolites, la présence très importante de l&#8217;actualité des régions ou leur classement des députés qui cumulent. Mais c&#8217;était le rendez-vous du <em>&#8220;buzz&#8221;</em>.</p>
<p><em>&#8220;C&#8217;était un beau laboratoire&#8221;</em> continue Guy Birenbaum. C&#8217;est par exemple sur Le Post qu&#8217;on pouvait, avant que Twitter ne soit tant utilisé, commenter en direct les émissions, parfois avec des accords commerciaux comme avec La Nouvelle Star. La page d&#8217;accueil du Post de la grande époque ressemble à de nombreuses timeline de Twitter aujourd&#8217;hui.</p>
<p>Ma route a croisé celle du Post régulièrement. Quand j&#8217;ai raconté comment on pouvait recevoir une amende de 4 euros pour avoir traversé au petit bonhomme rouge.</p>
<p><img class="aligncenter size-full wp-image-922" title="Contravention" src="http://blog.alphoenix.net/wp-content/uploads/2012/01/contravention.jpeg" alt="" width="1480" height="1132" /></p>
<p>Quand j&#8217;ai propulsé <a href="http://www.youtube.com/watch?v=tf4nUUM6t-Q&amp;feature=plcp&amp;context=C392c825UDOEgsToPDskIC2II0KUC8vFvJynBVySTM">une vidéo d&#8217;anti-Hadopi</a>, qui avait recueilli de nombreuses vues, grâce au fait qu&#8217;elle soit <em>&#8220;vue sur la une&#8221;</em>. Ou encore quand j&#8217;ai <a title="Internet + Cats = ♡" href="http://blog.alphoenix.net/2009/07/internet-cats-%e2%99%a1/">déclaré mon amour aux chats</a>. Quand j&#8217;ai participé en 2009, à <a href="http://enikao.wordpress.com/2010/01/13/tweest-by-le-post-livewire-muckrack-des-rivieres-de-flux-twitter-selectionnes/">la plateforme <em>Tweest</em></a> permettant de suivre politiques et journalistes sur Twitter sans forcément ouvrir un compte sur le réseau social.</p>
<p>Alors lundi, Le Monde lance Le Huffington Post qui va remplacer <em>Le Post</em>. <em>&#8220;Les autres pages du site LePost.fr seront placées en mode archive et resteront accessibles en ligne quelque temps encore&#8221;</em> <a href="http://www.lepost.fr/article/2012/01/20/2682620_du-post-au-huffingtonpost.html">indique La Marianne du Post</a>. Quelque temps. En attendant, chaque utilisateur peut télécharger sur son ordinateur son propre contenu écrit sur le site à l&#8217;adresse <a href="http://backup.lepost.fr/">backup.lepost.fr</a>. C&#8217;est à dire ses articles.</p>
<p>Bien sûr, c&#8217;est mieux que rien. Mais il manque les commentaires, il manque la navigation. Il manque le reste. En 2009, Yahoo! <a title="De la cyber-archéologie et de GeoCities" href="http://blog.alphoenix.net/2009/10/de-la-cyber-archeologie-et-de-geocities/">avait de la même manière fermé Geocities, immense plate-forme d&#8217;hébergement gratuit</a>, qui hébergeait une grande part de l&#8217;Internet vernaculaire. Vernaculaire qui avait d&#8217;ailleurs une belle place au sein du Post, avec ses illustrations faites sur Paint, ces vidéos de chats et autres montages vidéos.</p>
<p>Respect donc au Post, aux posteurs, à Jean Dujardin, à Aude et Maru, aux Alexandre.</p>
<p>Et comme on dit en Bretagne : adieu vat !</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.alphoenix.net/2012/01/le-posteur-a-trepasse/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Carte des circonscriptions parisiennes</title>
		<link>http://blog.alphoenix.net/2012/01/carte-des-circonscriptions-parisiennes/</link>
		<comments>http://blog.alphoenix.net/2012/01/carte-des-circonscriptions-parisiennes/#comments</comments>
		<pubDate>Tue, 17 Jan 2012 18:20:15 +0000</pubDate>
		<dc:creator>alphoenix</dc:creator>
				<category><![CDATA[Techjournalisme]]></category>
		<category><![CDATA[carte]]></category>
		<category><![CDATA[data]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[paris]]></category>
		<category><![CDATA[politique]]></category>

		<guid isPermaLink="false">http://blog.alphoenix.net/?p=914</guid>
		<description><![CDATA[Les élections législatives de 2012 auront au moins d&#8217;inédit leur contour. Une réforme électorale a modifié le périmètre des circonscriptions. La situation dans certaines circonscriptions est assez simple. Par exemple, la Creuse ne compte qu&#8217;une seule grosse circonscription. Mais Paris en compte dix-huit. Pour présenter les différents conflits, la solution d&#8217;une carte a été choisie &#8230;]]></description>
			<content:encoded><![CDATA[<p><iframe width="700" height="400" frameborder="0" scrolling="no" marginheight="0" marginwidth="0" src="http://maps.google.com/maps/ms?msa=0&amp;msid=214442624215388738789.0004b6bd3d8c6403711a8&amp;ie=UTF8&amp;t=h&amp;vpsrc=1&amp;ll=48.858697,2.347849&amp;spn=0.085156,0.243841&amp;output=embed"></iframe></p>
<p>Les élections législatives de 2012 auront au moins d&#8217;inédit leur contour. Une réforme électorale a modifié le périmètre des circonscriptions. La situation dans certaines circonscriptions est assez simple. Par exemple, la Creuse ne compte qu&#8217;une seule grosse circonscription. Mais Paris en compte dix-huit. Pour présenter les différents conflits, la solution d&#8217;une carte a été choisie sur Le Monde.fr</p>
<p>Il a fallu donc représenter sur une carte les limites des circonscriptions. Celles-ci ne sont disponibles nul part. Séverin Naudet, qui opère data.gouv.fr a annoncé le mercredi 11 janvier lors de <a href="http://hackthepress.net/">Hack the press</a> que l&#8217;IGN devrait diffuser prochainement ces données. En attendant, il faut se débrouiller tout seul.</p>
<h2>À la main</h2>
<p><a href="http://legifrance.gouv.fr/affichCode.do;jsessionid=12FCB24CD940482759888B4DA9C912B5.tpdjo13v_1?idSectionTA=LEGISCTA000006115471&amp;cidTexte=LEGITEXT000006070239&amp;dateTexte=20120117">L&#8217;annexe 1 du Code électoral donne le détail écrit</a> de chaque circonscription. La préfecture d&#8217;Île-de-France <a href="http://www.ile-de-france.pref.gouv.fr/La-prefecture-et-vous/Particuliers/Elections/Elections-legislatives-2012/Perimetre-des-nouvelles-circonscriptions-legislatives-a-Paris">met à disposition des cartes (en PDF)</a> permettant de visualiser ces circonscriptions à Paris, par circonscription ou par arrondissement. Donc le seul moyen pour faire une Google Maps convenable est de tout faire soi-même. À la main.</p>
<p>Pour ce faire, je me suis basé sur <a href="http://maps.google.com/maps/ms?msa=0&amp;msid=103763259662194171141.000001119b4b856600854">les limites des arrondissements en .kml</a>, disponible sur Internet. J&#8217;ai ensuite redessiné les limites avec <a href="http://www.birdtheme.org/useful/editkmlfile.php">un outil gratuit, proposé sur le site Birdtheme</a>. Il suffit de charger un kml, de cliquer la zone à modifier et de modifier ou supprimer les différents points composant la circonscription. Le travail fini, on se retrouve donc avec <a href="http://maps.google.com/maps/ms?authuser=0&amp;vps=2&amp;ie=UTF8&amp;hl=en&amp;oe=UTF8&amp;msa=0&amp;output=kml&amp;msid=214442624215388738789.0004b6bd3d8c6403711a8">un .kml de toutes les circonscriptions à Paris</a>.</p>
<p>J&#8217;ai ensuite utilisé l&#8217;API Google Maps pour contrôler et afficher les informations par circonscription. Pour faciliter la mise à jour des informations affichées, j&#8217;ai travaillé avec un Google Doc qui est joint à la carte grâce à <a href="http://oeildupirate.com/2011/09/17/gselper-et-vos-google-spreadsheets-deviennent-des-objets/">Gselper, une libraire développée par Pirhoo</a>.</p>
<p><a href="http://www.lemonde.fr/election-presidentielle-2012/visuel/2011/11/29/legislatives-2012-la-carte-des-batailles-de-paris_1607987_1471069.html">Et voilà !</a></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.alphoenix.net/2012/01/carte-des-circonscriptions-parisiennes/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Analyse géographique des résultats de la primaire</title>
		<link>http://blog.alphoenix.net/2011/12/analyse-geographique-des-resultats-de-la-primaire/</link>
		<comments>http://blog.alphoenix.net/2011/12/analyse-geographique-des-resultats-de-la-primaire/#comments</comments>
		<pubDate>Mon, 26 Dec 2011 23:09:04 +0000</pubDate>
		<dc:creator>alphoenix</dc:creator>
				<category><![CDATA[Techjournalisme]]></category>
		<category><![CDATA[journalisme]]></category>
		<category><![CDATA[parti socialiste]]></category>
		<category><![CDATA[politique]]></category>
		<category><![CDATA[primaire]]></category>

		<guid isPermaLink="false">http://blog.alphoenix.net/?p=864</guid>
		<description><![CDATA[Grâce au travail de Data Publica, et à la publication de données diverses par le Parti socialiste, n&#8217;importe qui dispose aujourd&#8217;hui de résultats assez complets sur la primaire socialiste, avec des détails sur les bureaux de vote, tels que géolocalisation, adresse, résultats. Une fois reliés les données entre elles, avec notamment la correspondance entre les &#8230;]]></description>
			<content:encoded><![CDATA[<p>Grâce au travail de <a href="http://www.data-publica.com/publication/5311">Data Publica</a>, et à <a href="http://data.parti-socialiste.fr/">la publication de données diverses par le Parti socialiste</a>, n&#8217;importe qui dispose aujourd&#8217;hui de résultats assez complets sur la primaire socialiste, avec des détails sur les bureaux de vote, tels que géolocalisation, adresse, résultats. Une fois reliés les données entre elles, avec notamment <a href="http://blog.alphoenix.net/wp-content/uploads/2011/12/id_BVP_equivalence_resultats_infos.csv">la correspondance entre les deux types d&#8217;identifiants de bureaux de vote</a>, pas mal de choses sont possibles.</p>
<p>Ces derniers temps, j&#8217;ai lu <a href="http://www.cevipof.com/bpf/analyses/analys0.htm">une analyse de Jérôme Fourquet sur le vote dans le péri-urbain</a> —très favorable au Front National—, la lecture <a href="http://www.amazon.fr/dp/2849412015">du livre de Christophe Guilluy sur les fracteures en France</a> —notamment entre les centres urbains et banlieues encouragées par la mondialisation, et le péri-urbain et le rural oublié par la mondialisation— ainsi que <a href="http://www.lemonde.fr/election-presidentielle-2012/article/2011/12/06/la-france-d-a-cote-ne-se-sent-plus-representee_1613839_1471069.html">les articles de Thomas Wieder et Françoise Fressoz sur la &#8220;France d&#8217;à côté&#8221; dans Le Monde</a>, et <a href="http://www.ifop.com/?option=com_publication&amp;type=publication&amp;id=392">l&#8217;étude de l&#8217;Ifop sur la géographie du vote aux primaires</a>.</p>
<p>J&#8217;ai donc tenté d&#8217;explorer les résultats des différents bureaux de vote à la primaire (BVP) en fonction de leur distances au 41 aires urbaines de plus de 200 000 habitants identifiés dans l&#8217;étude de l&#8217;Ifop et de voir si le &#8220;grand péri-urbain&#8221; avait voté différemment lors de cette primaire.</p>
<ul>
<li><strong>Mesurer la distance entre les bureaux de vote et les aires urbaines</strong></li>
</ul>
<p>Grâce aux longitudes et latitudes des BVP disponibles dans le fichier de recensement, j&#8217;ai automatisé la création de colonne pour chacune des aires urbaines dans <a href="http://code.google.com/p/google-refine/">Google Refine</a> indiquant la distance du BVP avec le centre de l&#8217;aire urbaine.</p>
<p>La formule de la distance est celle permettant de calculer <a href="http://fr.wikipedia.org/wiki/Orthodromie">la distance à vol d&#8217;oiseau entre deux points sur la Terre</a>. Ici, la création de colonne est décrite en json pour être systématisée dans Google Refine.</p>
<pre>[
	{
	"op": "core/column-addition",
	"description": "Create column Amiens at index 2 based on
column lat using expression.",
	"engineConfig": {
		"facets": [],
		"mode": "row-based"
	},
	"newColumnName": "Amiens",
	"columnInsertIndex": 2,
	"baseColumnName": "lat",
	"expression":
	"grel:acos(sin(radians(cells['lat'].value))*sin(radians(49.9
))+cos(radians(cells['lat'].value))*cos(radians(49.9))*cos(radians(
2.3-cells['lng'].value)))*6371",
	"onError": "set-to-blank"
	}
]</pre>
<p>Une fois les 41 colonnes crées, il faut garder la distance minimum. Comme Google Refine ne permet pas de calculer ceci facilement, j&#8217;ai tout versé dans un Google Spreadsheet —mais ça fonctionne aussi avec Excel, que je n&#8217;ai pas— <em>et voilà</em> !</p>
<ul>
<li><strong>Normalisation des scores</strong></li>
</ul>
<p>Les scores sont donnés par nombre de voix pour chaque bureau. Avec une simple requête dans Google Refine, j&#8217;ai transformée chaque colonne en un écart en points avec la moyenne nationale. J&#8217;ai ensuite fusionné les deux bases de données grâce à Google Refine en mettant en relation les deux colonnes d&#8217;identifiants des BVP.</p>
<pre>(value/cells["votantsPT"].value-0.3916)*100</pre>
<ul>
<li><strong>Comptage par zone géographique</strong></li>
</ul>
<p>Ne pouvant bénéficier des tableaux croisés dynamiques d&#8217;Excel, j&#8217;ai utilisé la fonction QUERY de Google Spreadsheet, qui permet d&#8217;utiliser chaque ligne d&#8217;un tableur comme un champ d&#8217;une base de données, et permet donc de connaître la répartition de l&#8217;écart aux scores en fonction de la distance du BVP au centre de l&#8217;aire urbaine.</p>
<pre>=query('Résultats bruts'!$A:$G;"select avg(B), avg(C), avg(D), 
avg(E), avg(F), avg(G) where A &lt;= 10 and A &gt; 20</pre>
<p>Le résultat est intéressant à plusieurs titres. Il montre que le vote pour François Hollande est &#8220;<em>massif et lissé</em>&#8220;, que celui d&#8217;Arnaud Montebourg est quasiment similaire, prouvant au passage l&#8217;absence de mobilisation des classes populaires pour le candidat de la démondialisation et que Martine Aubry, en revanche &#8220;<em>décroche dans le péri-urbain et le rural</em>&#8220;.</p>
<p><img class="aligncenter" src="https://docs.google.com/spreadsheet/oimg?key=0AiWUhxLpQgUXdF9nTmxRLVQzbWFlZVB5NWstd1dDbkE&amp;oid=1&amp;zx=a72hzrhg9i81" alt="" /></p>
<p>Cette &#8220;(en)quête de données&#8221; aurait pu être encore plus complète. Il manque notamment le lien entre les bureaux de vote à la primaire et les bureaux de vote républicains, permettant d&#8217;analyser la participation ou de comparer avec d&#8217;autres scrutins, au niveau du bureau de vote. De plus, la méthode géographique est légèrement faussé par l&#8217;effet d&#8217;amitié locale favorise légèrement les territoires ruraux et donc MM. Hollande et Montebourg.</p>
<p><em><strong>&gt;&gt; voir <a href="http://www.lemonde.fr/election-presidentielle-2012/article/2012/01/04/le-ps-a-peu-mobilise-l-electorat-populaire-lors-de-la-primaire_1625273_1471069.html">l&#8217;analyse sur Le Monde.fr</a></strong></em></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.alphoenix.net/2011/12/analyse-geographique-des-resultats-de-la-primaire/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>American Pie et Spotify</title>
		<link>http://blog.alphoenix.net/2011/12/american-pie-et-spotify/</link>
		<comments>http://blog.alphoenix.net/2011/12/american-pie-et-spotify/#comments</comments>
		<pubDate>Sat, 24 Dec 2011 16:44:20 +0000</pubDate>
		<dc:creator>alphoenix</dc:creator>
				<category><![CDATA[Folklore]]></category>
		<category><![CDATA[cinéma]]></category>
		<category><![CDATA[geek]]></category>
		<category><![CDATA[spotify]]></category>

		<guid isPermaLink="false">http://blog.alphoenix.net/?p=889</guid>
		<description><![CDATA[Je me souviens d&#8217;un jeune assez fier de lui. Nous étions en 2003 et un de ses hobbies du moment était la collection de cds de tous les artistes présents sur la bande-originale du film American Pie. Belle occupation qui devait lui occuper des journées de recherche dans les bacs, à pister les nouvelles sorties, &#8230;]]></description>
			<content:encoded><![CDATA[<p><img class="aligncenter size-full wp-image-892" title="alyson_hannigan-with-flute" src="http://blog.alphoenix.net/wp-content/uploads/2011/12/alyson_hannigan-with-flute.jpeg" alt="" width="800" height="409" /></p>
<p>Je me souviens d&#8217;un jeune assez fier de lui. Nous étions en 2003 et un de ses hobbies du moment était la collection de cds de tous les artistes présents sur la bande-originale du film American Pie. Belle occupation qui devait lui occuper des journées de recherche dans les bacs, à pister les nouvelles sorties, les présences sur des compilations. Une connaissance sûrement pointue du <em>punk rock</em> présent en long et en large dans le film, et associé à jamais au gobelets rouges en plastique et aux années <em>college</em>.</p>
<p>En regardant le film hier, je me disais qu&#8217;en dix minutes, aujourd&#8217;hui, le jeune curieux aurait pu se constituer une bonne grosse playlist, voire <a href="http://www.infos-du-net.com/forum/168861-24-musique-american">trouver des amis en ligne qui partagent la même passion</a> et leur envoyer. Putain, l&#8217;Internet, même si ça ne marchera jamais, ça a ruiné la vie de nombreux geeks. Aujourd&#8217;hui, il passerait certainement le temps non pris à chercher des cds à brûler des voitures.</p>
<p>Et puis moi, regardant du le village où j&#8217;ai grandi American Pie <a href="http://blog.alphoenix.net/2011/12/jouvence/">où tous les acteurs ont cinq ans de plus que n&#8217;importe quel lycéen</a>, ça fait un peu <a href="http://www.monsieurlam.com/2011/12/23/un-signal-dans-la-nuit">bip</a>.</p>
<p><img class="aligncenter" title="Bip" src="http://www.monsieurlam.com/wp-content/2011/12/bip.gif" alt="" width="585" height="428" /></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.alphoenix.net/2011/12/american-pie-et-spotify/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>La longévité des députés</title>
		<link>http://blog.alphoenix.net/2011/12/la-longevite-des-deputes/</link>
		<comments>http://blog.alphoenix.net/2011/12/la-longevite-des-deputes/#comments</comments>
		<pubDate>Fri, 23 Dec 2011 23:30:58 +0000</pubDate>
		<dc:creator>alphoenix</dc:creator>
				<category><![CDATA[Techjournalisme]]></category>
		<category><![CDATA[Assemblée Nationale]]></category>
		<category><![CDATA[opendata]]></category>
		<category><![CDATA[politique]]></category>

		<guid isPermaLink="false">http://blog.alphoenix.net/?p=879</guid>
		<description><![CDATA[Malgré l&#8217;ouverture de data.gouv.fr, le portail de données du gouvernement, de nombreuses données restent encore difficiles d&#8217;accès. Au moment où Arnaud Montebourg s&#8217;escrimait à limiter l&#8217;âge des candidats aux législatives à 67 ans, en novembre 2011, on s&#8217;est posé la question de la longevité des députés. Pour encourager le renouvellement, plus que d&#8217;interdire les plus &#8230;]]></description>
			<content:encoded><![CDATA[<p style="text-align: left;">Malgré l&#8217;ouverture de <a href="http://data.gouv.fr">data.gouv.fr</a>, le portail de données du gouvernement, de nombreuses données restent encore difficiles d&#8217;accès. Au moment où Arnaud Montebourg s&#8217;escrimait à limiter l&#8217;âge des candidats aux législatives à 67 ans, en novembre 2011, on s&#8217;est posé la question de la longevité des députés. Pour encourager le renouvellement, plus que d&#8217;interdire les plus âgés, peut-être faudrait-il interdire les cumulards dans le temps. Une Assemblée représentative ne pouvait pas se priver des plus de 65 ans qui représente 16 % de la population.</p>
<p><img class="aligncenter  wp-image-881" title="Assemblée Nationale" src="http://blog.alphoenix.net/wp-content/uploads/2011/12/54045981_69fdd27cb4_o.jpeg" alt="" width="1280" height="960" /></p>
<p><a href="http://www.laviedesidees.fr/L-age-de-l-Assemblee-1946-2007,81.html">Les travaux de Louis Chauvel</a> avaient bien décrits la façon dont l&#8217;Assemblée vieillissait depuis 1981. <a href="http://abonnes.lemonde.fr/cgi-bin/ACHATS/acheter.cgi?offre=ARCHIVES&amp;type_item=ART_ARCH_30J&amp;objet_id=1173508">L&#8217;Assemblée élue en 2007 est la plus vieille de la Ve république</a> a titré Le Monde. Avec en conclusion des pistes sur la limitation des mandats à deux successifs.</p>
<p>Pour récupérer des informations intéressantes sur le travail des députés, c&#8217;est un peu ardu. Rien n&#8217;existe encore. Heureusement, leur site est moins mal codé que prévu, et on peut y récupérer facilement des informations.</p>
<p>J&#8217;ai d&#8217;abord récupéré l&#8217;ensemble des identifiants sur le site des 562 députés siégeant grâce à <a href="http://www.assemblee-nationale.fr/qui/xml/liste_alpha.asp?legislature=13">l&#8217;affichage alphabétique</a> et à un simple ctrl+F dans Textmate. Textmate est un éditeur de texte pour Mac, très agréable pour coder, et très intéressant pour ses opérations sur le texte grâce au <em>Rechercher et remplacer</em> permettant notamment les expressions régulières.</p>
<p>J&#8217;ai donc créé un script php, qui récupère en Curl le contenu de toutes les pages députés du site. En filtrant le html récupéré avec des expressions régulières, j&#8217;ai pu mettre en base tout ce qu&#8217;il me fallait —nom et prénom du député, groupe, date de naissance et les différentes périodes d&#8217;élections et réélections.</p>
<p>Une fois <a href="http://www.nosdonnees.fr/package/les-dputs-franais">tout récupéré dans un sql</a>, les calculs furent rapides et simple à obtenir.</p>
<p>On peut savoir que en moyenne, un député actuellement à l&#8217;Assemblée y a siégé onze ans et demi. Sur l&#8217;ensemble des députés, 31% ont été élus pour la première fois en 1997 ou avant et 31% ont siégé plus de 15 ans. Un tiers des parlementaires qui se maintient, année après année, sur leurs circonscriptions. <a href="http://www.assemblee-nationale.fr/13/tribun/fiches_id/1746.asp">Didier Julia</a>, élu député de Seine-et-Marne le 12 mars 1967, a ainsi vu tous les présidents de la Ve République défiler alors qu&#8217;il siégeait à l&#8217;Assemblée. Et ils sont sept à avoir été élu avant la mort du Président Pompidou. <a href="http://www.assemblee-nationale.fr/13/tribun/fiches_id/2661.asp">Michel Sainte-Marie</a>, député de Gironde est de ceux-là lui donnant la plus longue longévité à gauche.</p>
<p>Bien évidemment, ces chiffres sont utiles à tous les citoyens, et en disposer nous permettrait une meilleure connaissance de l&#8217;Assemblée.</p>
<p>Bien évidemment, ces données sont rangées telles que dans des bases de données, pour alimenter le site de l&#8217;Assemblée, qui affiche en moins de deux millisecondes une fiche biographique pour n&#8217;importe quel député, passé ou présent.</p>
<p>Mais, bien évidemment, personne ne souhaite les rendre publics. L&#8217;Assemblée ne comprend même pas de quoi on parle lorsqu&#8217;on demande la longévité moyenne de ses parlementaires. Le temps de l&#8217;open-data est encore loin.</p>
<hr />
<p>photo <a href="http://www.flickr.com/photos/nunocardoso/54045981/in/photostream/">Flickr cc NunoCardoso</a></p>
]]></content:encoded>
			<wfw:commentRss>http://blog.alphoenix.net/2011/12/la-longevite-des-deputes/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
	</channel>
</rss>

