Home InternationalIA et journalisme de données : l’exemple de The Hindu

IA et journalisme de données : l’exemple de The Hindu

BANGALORE, Inde – Le quotidien indien The Hindu utilise l’intelligence artificielle pour accélérer ses enquêtes de journalisme de données, en traitant des volumes massifs de données et en créant des outils interactifs sans recourir à une programmation manuelle intensive. L’objectif n’est pas de remplacer les journalistes, mais de leur permettre d’aller plus loin dans leurs investigations, a déclaré Srinivasan Ramani, rédacteur adjoint national et rédacteur associé principal du journal, lors d’un récent forum sur l’IA et les médias.

Ces derniers mois, l’équipe du Hindu a analysé près de 22 millions d’enregistrements d’électeurs dans trois États indiens, a créé une interface de résultats électoraux sans écrire une seule ligne de code manuellement et a assemblé des capteurs de chaleur à faible coût pour mesurer l’expérience de différents travailleurs face à des températures extrêmes.

L’IA, selon Ramani, agit comme un « stagiaire très sophistiqué », exécutant des tâches spécifiques sur demande tout en laissant le contrôle final aux journalistes. « L’hypothèse était la nôtre. Le contexte politique et social était le nôtre. L’IA nous a aidés à traiter l’ampleur », a-t-il précisé.

Un projet majeur a porté sur l’examen de la révision intensive spéciale (SIR) des listes électorales en Inde, une mise à jour périodique effectuée par la Commission électorale. L’équipe a traité environ 90 000 fichiers (6,5 millions d’enregistrements) dans l’État de Bihar, 78 000 fichiers (9,7 millions d’enregistrements) dans le Tamil Nadu et 80 000 fichiers (5,8 millions d’enregistrements) dans le Bengale occidental. Les données, initialement sous forme de PDF numérisés en hindi, ont été converties en texte lisible par machine grâce à la reconnaissance optique de caractères (OCR), puis traduites en anglais et stockées dans des bases de données.

L’utilisation de modèles de langage étendu (LLM) a permis de générer des requêtes SQL à partir de simples instructions en langage naturel, évitant ainsi la nécessité d’écrire manuellement des commandes de base de données complexes. L’analyse a révélé des tendances troublantes, notamment un plus grand nombre de femmes que d’hommes radiées des listes électorales dans le Bihar, malgré une plus forte émigration masculine, et un nombre élevé de décès signalés pour des électeurs de moins de 50 ans dans plusieurs bureaux de vote.

Suite à une directive de la Cour suprême de l’Inde, le Hindu a créé une base de données consultable des noms radiés et des motifs invoqués, publiant des enquêtes spécifiques à chaque État. Les résultats ont suscité des débats au Parlement et dans les procédures judiciaires, conduisant à des corrections des listes électorales dans le Bihar après un examen attentif sur le terrain.

L’IA a également été utilisée pour créer des cartes interactives des résultats des élections générales indiennes de 2019 et 2024, permettant aux utilisateurs de filtrer les données par région, type urbain/rural et autres critères. Ramani a souligné qu’il n’avait pas écrit une seule ligne de code pour ces applications, les ayant entièrement construites en deux semaines à l’aide d’invites dans ChatGPT, Gemini et Claude.

Un autre projet a consisté à mesurer la chaleur au niveau de la rue à Chennai, où les températures estivales sont extrêmes. L’équipe a assemblé des appareils Arduino à faible coût pour enregistrer la température et l’humidité toutes les 10 secondes, ce qui a permis de mettre en évidence les disparités d’exposition à la chaleur entre différentes professions. Les résultats ont conduit le gouvernement du Tamil Nadu à annoncer un plan de gestion de la chaleur et à envisager d’utiliser des dispositifs similaires pour des études plus approfondies.

Ramani a insisté sur le fait que l’IA s’intègre dans un processus de journalisme de données bien établi, comprenant la formulation d’hypothèses, la collecte de données, le nettoyage, l’analyse, la visualisation et la publication. Il a souligné l’importance de la supervision humaine, citant un exemple où un script généré par l’IA a ralenti l’analyse en traitant les documents séquentiellement, une erreur corrigée grâce à l’intervention d’un technicien qui a suggéré le traitement parallèle.

Le Hindu a vu une augmentation des abonnements et de l’engagement pour ses reportages basés sur les données, qui sont désormais intégrés à l’ensemble de ses opérations d’impression et numériques. L’objectif, selon Ramani, est de créer un public plus informé, l’IA élargissant l’échelle à laquelle le journalisme peut opérer sans remplacer le jugement journalistique.

You may also like

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.