La Société des Nations à l’ère du numérique

14 October

Les archives de la Société des Nations (SdN) retranscrivent l’histoire du monde. Mis bout à bout, ces trois kilomètres de documents hébergés à la Bibliothèque des Nations Unies, à Genève, contiennent des informations historiques toujours pertinentes aujourd’hui . Mais ils sont difficiles à déchiffrer électroniquement, même après avoir été scannés, car ce sont souvent des copies de mauvaise qualité qui se sont détériorées avec le temps. La tâche est donc énorme pour rendre accessibles ces précieuses archives. Des étudiants participant au SDG Summer School, une initiative de l’Université de Genève (UNIGE) en collaboration avec l’Université de Tsinghua en Chine, ont mis au point un projet qui non seulement permet au grand public d’accéder en ligne et de déchiffrer les documents de la SdN, mais qui aide également à la création d’une intelligence artificielle capable d’assister l’homme dans la digitalisation des archives. Ce projet, nommé «League of Nations in the Digital Age», est lancé publiquement aujourd’hui lors de la Journée Portes Ouvertes de l’ONU à Genève.

L’intelligence humaine est absolument indispensable pour déchiffrer les archives de la SdN. Grâce au projet «League of Nations in the Digital Age», monté par une équipe d’étudiants du SDG Summer School, le grand public peut aujourd’hui participer à cette tâche titanesque en se connectant à la plateforme de crowdsourcing Zooniverse et en vérifiant des informations clés sur des centaines de pages de documents. Mais l’aventure ne s’arrête pas là car l’objectif du projet est double : d’une part faire appel au grand public pour déchiffrer ces archives, d’autre part encourager des passionnés de la programmation à utiliser les résultats de la digitalisation humaine comme point de départ pour améliorer des algorithmes de «machine learning», utilisés dans les logiciels de reconnaissance de caractères (OCR). Ce second volet est rendu possible par une autre plateforme de crowdsourcing, CrowdAI, développée par des partenaires de l’EPFL. Son but, permettre à l’intelligence artificielle de faire un jour le travail de déchiffrage avec une qualité comparable à celle de l’être humain.

Des informations historiques toujours pertinentes

«Si nous réussissons à marier ces deux technologies, et ainsi à combiner l’intelligence humaine et l’intelligence artificielle de façon efficace, il sera dès lors possible d’aider les Nations Unies à accélérer la digitalisation d’une vaste collection de documents précieux», souligne François Grey, professeur à l’Université de Genève et l’un des oganisateurs des SDG Summer School. Une fois numérisées, ces archives deviendront facilement consultables et accessibles par date, titre, événement, etc. En effet, comme le souligne Colin Wells de la Bibliothèque des Nations Unies et mentor du projet : «Les archives de la SdN contiennent des informations historiques toujours pertinentes aujourd’hui, que ce soit des innovations en droit international, santé globale ou échanges multilatéraux. Même les efforts de diplomatie internationale au cœur de la SdN qui ont précédé la Deuxième guerre mondiale, contiennent des leçons importantes pour maintenir la paix dans le monde.»

Les résultats atteints par la SDG Summer School seront également utilisés dans le cadre d’un autre projet baptisé «Total Digital Access to the League of Nations Archives», un projet à long terme qui prévoit de scanner et de mettre en ligne la totalité des archives de la SdN qui comptent quelque 15 millions de pages.

Luping Xu, professeur à l’Université de Tsinghua, a organisé pour les étudiants une semaine au sein du pôle high-tech de Shenzen. Il souligne un résultat inattendu du projet que l’expérience des étudiants en Chine a stimulé : «Inspirés par toutes les technologies numériques accessibles à Huaqiangbei, gigantesque quartier de Shenzhen dédié aux produits électroniques bon marché, les étudiants ont même inventé et construit, avec une imprimante 3D, un scanneur de documents portable dont les composants valent moins de 60CHF. Cet outil peut déjà communiquer avec des systèmes d’intelligence artificielle en ligne et pourra, à terme, permettre une digitalisation de documents, même dans des pays sans accès aux machines de digitalisation plus sophistiquées.»