Des séries policières pourraient favoriser l’utilisation de l’intelligence artificielle dans les enquêtes

Coordonné par l’Institut de Recherche Idiap, le projet Roxanne a pour but d’introduire les technologies de l’intelligence artificielle dans les forces de l’ordre afin de faciliter l’analyse des crimes à grande échelle. Il y a quelques jours, les séries policières ont été parmi les premiers sets de données utilisés pour présenter les premiers pas de ces technologies aux partenaires du projet.

Les séries policières tiennent généralement le spectateur en haleine grâce à la recherche des différents indices qui permettent de résoudre le crime de l’épisode. Appels téléphoniques, courriels, entretiens font partie des éléments-clés pour résoudre un cas. En tant qu’humain nous sommes habitués à croiser ces différentes sources pour créer des liens et extraire de l’information pertinente. Mais qu’en est-il des ordinateurs ? En utilisant des technologies d’intelligence artificielle telles que l’analyse de réseau ou le deep et le machine learning, les chercheurs peuvent alimenter un programme informatique avec les mêmes éléments. Le but est d’apprendre à l’ordinateur à créer des rapprochements similaires. Financé par l’Union européenne et coordonné par l’Idiap, le projet Roxanne regroupe scientifiques, industriels et divers services de polices de 16 pays. Leur ambition est de développer des outils réalistes basés sur l’intelligence artificielle pour doper les enquêtes.

Dans les cas réels, le principal obstacle provident de la diversité des sources : enregistrements vocaux, messages écrits, images, vidéos, empreintes digitales… Mais également de la variété des support d’information utilisés par les différentes forces de l’ordre. Afin de concevoir et développer un outil flexible, les partenaires du projet souhaitent disposer d’un service aussi autonome que possible et évitant des composants interdépendants. Avoir des interfaces standardisées est également primordial pour un outil efficient.

L’architecture des technologies intégrées est basée sur un set d’outils développés par un groupe de partenaires. Ces derniers ont conçu une solution d’analyse de plusieurs sources grâce à un concept d’architecture générique qui permet de regrouper des programmes d’analyse multimédia et de les présenter dans différentes configurations basées sur une organisation générique commune. Cette approche offre une grande flexibilité en permettant de tester et de valider toutes les configurations nécessaires sur la même plateforme durant le projet.

Entraînement avec des séries policières et des cas non résolus avant une première diffusion

Lors du développement et du test de technologies d’analyse vocale, textuelle, vidéo ou de réseaux, il y a des contraintes éthiques et légales liées à l’utilisation de données provenant d’enquêtes réelles. Malgré tout, il existe des données déjà disponibles et pouvant être exploitées entièrement ou en partie pour le projet. Au rang de ces ressources de nombreux appels téléphoniques entre des interlocuteurs différents, plus d’un demi-million de courriels anonymisés et de retranscriptions de discussions téléphoniques, ainsi que des épisodes de la série américaine Les Experts. Chaque épisode consiste en une vidéo d’environ 40 minutes, d’un fichier audio et d’une retranscription. L’audio et la vidéo sont extraits des DVD de l’émission, alors que les retranscriptions ont été publiées par l’Université d’Édimbourg. Ces derniers contiennent également le rôle de chaque intervenant (suspect, meurtrier ou autre).

Il y a quelques jours, environ 80 participants se sont réunis à distance pour le premier test de terrain. Réussite, c’est première expérience a impliqué de nombreuses technologies, telles que la reconnaissance vocale, l’identification d’interlocuteur et de genre, la détection de mots-clés et de sujets, la reconnaissance d’entité ou l’analyse de réseau. Ces outils sont essentiels pour extraire de l’information pertinente des données. Par exemple la détection du genre de l’interlocuteur peut diminuer le nombre de suspects. Les premiers résultats fournis par les partenaires ont été incorporés dans un outil interactif d’analyse de réseau, capable d’afficher pour chaque nœud du dit réseau l’identité et le genre prédite par les programmes. Un tel dispositif peut aider les services de police à identifier les interlocuteurs impliqués dans une enquête criminelle.

Un important travail a également été requis par la Commission européenne pour répondre aux critères éthiques, ainsi qu’aux enjeux sociétaux et de respect de la vie privée. Le projet est ainsi régulièrement soumis à des évaluations et des contrôles. Suite à ces vérifications deux autres version de ce système seront mises à disposition des partenaires, une 2021 et l’autre en 2022.

Plus d’informations

-    Projet Roxanne
-    Groupe de recherche Audio & Speech Processing