SDialog : la boîte à outils en libre accès de l’Idiap pour une IA reproductible
Une approche scientifique rigoureuse nécessite la capacité de comparer, reproduire et étendre les travaux antérieurs, un objectif encore difficile à atteindre dans le domaine des systèmes de dialogue. Pour répondre à ce défi, les chercheurs d’Idiap ont développé SDialog, une boîte à outils Python entièrement en libre accès, conçue pour rendre tout le processus de développement de l’IA conversationnelle plus structuré, transparent et reproductible. Cette boîte à outils est disponible librement sur GitHub sous licence MIT. Elle représente une contribution concrète de l’Idiap au développement de la science ouverte en intelligence artificielle.
SDialog permet de gérer toutes les étapes de création d’un système de dialogue dans un seul cadre : créer des agents, simuler des utilisateurs, générer des conversations et tester les performances. Cela évite d’avoir à combiner plusieurs outils séparés et simplifie le travail de recherche.
Ses fonctionnalités clés sont :
- Simulation réaliste : création de persona détaillés et génération de conversations plausibles entre eux.
- Format standardisé : stockage et partage des données de dialogue dans un format unifié.
- Évaluation intégrée : métriques permettant de comparer facilement la qualité des dialogues et des systèmes.
- Analyse des modèles : exploration du fonctionnement interne des modèles et possibilité d’influencer leur comportement.
- Génération audio : transformation de dialogues textuels en conversations orales réalistes.
- Compatibilité étendue : interopérabilité avec la majorité des grandes plateformes d’IA.
Le choix de publier SDialog en libre accès n’est pas anodin : il reflète un engagement affirmé de l’Idiap envers les principes de la science ouverte. L’ensemble des données SDialog sont également mis à disposition sur Hugging Face pour l’ensemble de la communauté.
Ce niveau d’ouverture est aujourd’hui reconnu comme essentiel pour garantir la fiabilité de la recherche en IA. Le partage des méthodes et des outils permet la vérification indépendante des résultats, la reproduction des expériences et un progrès collectif fondé sur l’accumulation des connaissances plutôt que sur des efforts isolés.
SDialog a récemment été présenté sous forme de démonstration système lors de la conférence EACL 2026 à Rabat, l’un des principaux rendez-vous européens en traitement automatique des langues.
Le projet a été développé dans le cadre du programme européen Horizon 2020 (projet ELOQUENCE) et a également bénéficié de contributions lors de l’atelier JSALT 2025 à l’Université Johns Hopkins, illustrant la dimension collaborative internationale des recherches menées par Idiap. Le dépôt a déjà suscité un intérêt notable au sein de la communauté, avec plus de 125 étoiles et 25 forks sur GitHub depuis sa publication.
SDialog est accessible sur GitHub (github.com/idiap/sdialog), avec une documentation complète disponible sur sdialog.readthedocs.io. Une démonstration vidéo ainsi que des tutoriels interactifs sont également proposés pour une prise en main rapide.
Les chercheurs et développeurs souhaitant contribuer — que ce soit par la conversion de jeux de données, la proposition de nouvelles métriques d’évaluation ou le signalement de bugs — sont invités à ouvrir une issue sur GitHub.