Les data en forme

Le 26 mars 2012

Après une semaine de pause, la veille des journalistes de données d'OWNI revient plus en forme que jamais. Au programme : une odyssée de data, une plongée dans la démocratie, une carte pour jouer au terroriste nucléaire et quelques data-outils à garder en poche. Bonne semaine !

Découvrir un texte vieux de plus de 3 000 ans sous un angle totalement inédit, c’est le projet magique de Santiago Ortiz, disponible sur son site moebio.com. Il a créé deux datavizualisations interactives de l’Iliade : une version “stream” qui permet d’observer quels sont les personnages les plus présents dans les différents livres de l’oeuvre d’Homère et une version “network” pour visualiser les relations entre les personnages.

Chaque personnage, symbolisé par un rectangle, est relié à un autre si ils dialoguent dans L’Iliade. De fait, plus un personnage est présent et interagit avec les autres, plus son poids graphique est important.

Achille, Hector et Zeus vont désormais devoir faire attention à leur e-reputation.

Maîtriser les effets nucléaires

Âmes sensibles s’abstenir. La carte d’Alex Wellerstein, historien spécialisé sur les armes nucléaires et travaillant à l’Institut américain de physique, est construite sur une idée politiquement peu correcte.

La bien nommée Nukemap – “Le calculateur d’Alex des effets nucléaires” ayant été jugé insuffisamment sexy par les amis du créateur – vous propose de faire exploser une bombe nucléaire de votre choix, à l’endroit de votre choix, et de visualiser les effets produits, au moyen de cercles concentriques de couleurs allant du rouge au vert et légendées.

Ainsi, si vous décidez de faire exploser à Paris une bombe “Little Boy” (du type de celles utilisées à Hiroshima), le rayon de l’explosion d’air où le taux de décès approcherait de 100 % serait une zone de 0,7 km2, allant de Rambuteau au nord, à Saint-Paul à l’est, Maubert-Mutualité au sud et presque Pont-Neuf à l’ouest.

Alex Wellerstein se défend de toute volonté morbide ou d’incitation au terrorisme : son projet est essentiellement à but de recherche, créé dans le cadre d’un des cours qu’il assurait sur l’histoire des armes nucléaires. Sa carte permet par exemple de comparer les puissances des premières bombes nucléaires à celles utilisées de nos jours.

Au 23 février 2012, son outil avait été utilisé plus d’un million de fois, pour 190 000 visiteurs. Il en a tiré une autre cartographie, qui visualise les lieux d’explosions les plus souvent choisis par les internautes : l’Europe et les États-Unis sont sureprésentés.

I love dataviz-democracy

Autre oldlink mais que nous avions vraiment envie de faire figurer dans notre veille, l’application développée par la start-up Dataveyes pour le compte d’Arte, à l’occasion de la sortie des séries de documentaires “I love Democracy”.
L’application présente les portraits de sept pays – États-Unis, Maroc, Tunisie, Grèce, Turquie, Russie, Inde – selon six indicateurs résumés en dataviz : longévité du chef de l’État, situation démocratique, scolarisation, inégalités hommes/femmes, facebook et Internet, inégalités de richesse. A ces indicateurs s’ajoute un tableau récapitulatif, et la possibilité de comparer ces sept pays-phares avec les autres nations du monde.

Plus que les données en elles-mêmes, ce sont les formes de datavizualisations, le graphisme et la navigation choisie qui font sortir cette application du lot. Seul bémol : la comparaison des pays pour la situation démocratique, peu claire.

La présidentielle s’analyse

Deux applications orientées vers la présidentielle ont particulièrement retenu notre attention ces dernières semaines.

La plus récente, lancée par Data publica en partenariat avec Matière primaire, est un observatoire des candidats sur Twitter à plusieurs variables : le nombre de followers, la sémantique – termes qui reviennent le plus souvent dans les tweets qui parlent d’un candidat sur une période donnée : mois, semaine ou dernières 24 h – et le bruit – nombre de tweets lié à chacun des candidats.
Basé sur l’API de search de twitter, l’application est mise à jour toutes les 30 minutes et récupère ainsi jusqu’à 1 500 tweets par candidat.
Cette base de données relativement exhaustive, servie par le design caractéristique et minimaliste de Matière primaire en font un outil agréable et utile.
Par exemple “Toulouse” arrivait en tête de la sémantique analysée hier pour les candidats Marine Le Pen, Nicolas Sarkozy, Eva Joly et François Hollande (2ème position) alors que c’était la cinquième thématique la plus citée pour François Bayrou et Jean-Luc Mélenchon.

Moins récente, mais toujours d’actualité l’application d’analyse des discours des candidats à la présidentielle développée par Linkfluence et Jean Véronis Technologies pour LeMonde.fr.
Outil sémantique, il propose l’analyse informatisée de plus de 1 100 discours discours politiques (uniquement des discours publics) avec des fonctionnalités permettant de rentrer en profondeur dans les sujets : filtrer les discours par candidat, choisir les thèmes abordés, sélectionner les discours selon une période au moyen de la timeline, comparer la présence des pronoms et surtout visualiser les thèmes les plus présents dans chaque discours.
On regrette juste l’absence d’une fonctionnalité permettant de comparer les discours de candidats différents. Peut-être pour 2017 ?

La place rouge en open data

La Russie se met au datajournalisme : c’est en tout cas ce qu’espère l’équipe de journalistes et citoyens à l’intiative du site datajournalism.ru. Graphiquement très réussi, ce site entend à la fois :
- proposer une veille sur le data journalisme (nombreux liens vers le Datablog du Guardian) et inciter à la création d’une école de data journalisme en Russie ;
- mettre en contact journalistes, développeurs et designer pour monter des projets
- promouvoir l’open data en Russie (souhaitons-leur bonne chance) et publier les données déjà ouvertes.
Tout cela est également dans un but compétitif : le site datajournalism.ru espère présenter un candidat aux premiers Data Journalism Awards organisés par le GEN (Global Editor Networks), Google et le Centre de journalisme européen (CEJ).

En parlant d’Open Data, un lien qui fait rêver : la carte des retards de train en temps réel. Pas besoin de commenter, juste d’admirer.

Remplir sa data-boîte à outils

On termine cette chronique par deux initiatives de data journalisme version pratique.
L’une à suivre : la toute récente annonce de la part de Wikipédia de créer “Wikidata“, base de données gratuite, collaborative, multilingue permettant de collecter des données structurées.

L’autre à utiliser dès maintenant : datawrapper.de, l’outil de datavisualisation gratuit et en ligne développé par les data journalistes Nicolas Kayser-Bril et Mirko Lorenz pour l’ABVZ – organisation de formation des journalistes affiliée à BDVZ (Association des éditeurs de presse allemands). A l’image de Google Charts ou de Many Eyes, Datawrapper permet de créer des graphiques et des visualisations embeddables facilement sur son site internet.

Bonne data-semaine à tous !


Retrouvez tous les épisodes des Data en forme !

Laisser un commentaire

Derniers articles publiés