Durant la confĂ©rence Dataharvest, qui sâest dĂ©roulĂ© du 18 au 20 mai Ă Bruxelles, une partie des Ă©changes sâest concentrĂ©e sur «les algorithmes». On a dĂ©jĂ parlĂ© ici de tout ça, avec notamment quelques recommandations de lecture. «Les algorithmes», câest un mot fourre-tout pour parler de lâanalyse de masse de grand nombre de donnĂ©es, la prise de dĂ©cision Ă partir de ces analyses, automatisĂ©e ou non, ainsi que lâapprentissage des mĂȘmes logiciels Ă partir des dĂ©cisions prĂ©cĂ©dentes, et des nouvelles donnĂ©es.
Les algorithmes prennent de plus en plus de place dans la sphĂšre publique. Ils prennent des dĂ©cisions dâaffectation pour les lycĂ©es, participent de la dĂ©cision dâamĂ©nagement de peine dans certains Ă©tat amĂ©ricains, calculent les impĂŽts⊠Nicholas Diakopoulos Ă©tait invitĂ© de la confĂ©rence pour Ă©voquer son travail autour des algorithmes. Il travaille Ă lâUniversitĂ© du Maryland et a focalisĂ© une partie de ses recherches sur la questions des algorithmes et la maniĂšre dont les journalistes peuvent enquĂȘter dessus.
De multiples angles journalistiques sont Ă trouver dans les algorithmes : une discrimination, une injustice dans la dĂ©cision, des erreurs qui empĂȘchent le service de fonctionner, une censure possible, des prĂ©dictions erronĂ©es, un problĂšme avec la vie privĂ©e ou autres infractions. Tout ça, Ă coup dâingĂ©nierie renversĂ©e, dâenquĂȘtes sur les concernĂ©s par les dĂ©cisions de lâalgorithmes ou de simulation.
Code source et simulations
On peut citer lâexemple de ProPublica. Julia Angwin et ses collĂšgues ont enquĂȘtĂ© sur lâaide Ă la dĂ©cision concernant les remises de peine sur la prĂ©vention de la rĂ©cidive. Lâalgorithme dĂ©favorise les personnes noires. On peut aussi Ă©voquer lâalgorithme dâAdmission post-bac, dont une partie du code source a Ă©tĂ© dĂ©voilĂ© aprĂšs une longue bataille de lâassociation Droit des lycĂ©es Ă coup de demandes CADA. LâĂ©tude du code source avait mis en lumiĂšre le traitement de faveur accordĂ© aux lycĂ©ens inscrits Ă lâĂ©tranger.
Pour aider les journalistes Ă faire leur marchĂ© et voir ce qui existait, Diakopoulos a rassemblĂ© de nombreux algorithmes utilisĂ©s par les diffĂ©rentes administrations aux Ătats-Unis sur un seul site : algorithmtips.org. Le site devrait sâouvrir Ă dâautres pays prochainement. Laura Motet, journaliste au Monde, revient sur le contenu de la confĂ©rence de Nicholas Diakopoulos.
En France, la loi NumĂ©rique, votĂ©e lâan dernier va permettre de faire quelques avancĂ©es sur le sujet. Un de ses articles prĂ©voit que les citoyens soient informĂ©s de toutes les dĂ©cisions de lâadministration le concernant sont issues dâun algorithme. Les donnĂ©es utilisĂ©es et les rĂšgles de fonctionnement doivent Ă©galement ĂȘtre communicables. Selon une fiche dâimpact accompagnant le dĂ©cret, les services du gouvernement estiment quâil y aurait une centaine dâalgorithmes concernĂ©s. A leur liste, on peut ajouter quelques oublis, comme les systĂšmes attribuant des places en crĂšches ou gĂ©rant lâaffectation des enseignants, entre autres. Tout ça pourra commencer Ă ĂȘtre explorĂ© Ă partir du 1er septembre.
Le travail journalistique sur les algorithmes devient, on lâa vu, une nĂ©cessitĂ© alors quâils prennent de plus en plus de place. Les rĂ©dactions doivent sâouvrir Ă la collaboration avec des statisticiens ou informaticiens Ă mĂȘme de comprendre les consĂ©quences de ces logiciels dans toujours plus de dĂ©cisions concernant tout le monde.