En 2010, lorsque son fils qui travaillait à l’époque chez IBM lui dit que l’entreprise s’orientait vers le « big data », Gérard Pelletier a dressé l’oreille. L’ancien vice-président au marketing de Concept-Action Multimedia a contacté Claude Coulombe, le créateur du Correcteur 101, consultant en IA appliquée et ami de longue date, pour lui lancer l’idée de concevoir un lexique en français de ce nouveau vocabulaire. DataFranca lançait donc le chantier du premier grand lexique français de l’intelligence artificielle à l’intention des professionnels de l’industrie, de la recherche et de l’enseignement en mars 2018.
Aujourd’hui, ce lexique compte 6 205 termes français expliqués sous forme de wiki et le livre « Les 101 mots de l’intelligence artificielle » est disponible pour la modique somme de 20 $. « Avant le lancement du lexique, j’ai été voir les gens de divers ministères, d’Investissement Québec et de la Caisse de dépôt et placement du Québec pour leur parler des données de masse, mais personne ne comprenait ce dont je parlais, raconte Gérard Pelletier. Il faut dire que ma documentation était en anglais. C’est à ce moment que nous nous sommes dit qu’il fallait un lexique. L’Office québécois de la langue française nous a appuyés dans notre démarche. »
Comme éditeur, le directeur général de DataFranca.org n’a pas choisi lui-même les mots inclus dans le lexique : il a plutôt fait appel à des spécialistes, dont Claude Coulombe, qui agit comme directeur scientifique de DataFranca.org, mais aussi Patrick Drouin, professeur au département de linguistique et de traduction de l’Université de Montréal, Serge Carrier, qui détient une maîtrise en biophysique. « Nous faisons ce travail pour les gens curieux qui veulent comprendre l’intelligence artificielle, note l’éditeur. Le livre comprend 146 mots, mais nous l’avons appelé « Les 101 mots de l’intelligence artificielle » en clin d’oeil à la Loi 101. » Des étudiants en traduction de 3e cycle universitaire participent en outre à la rédaction des mots, un bassin qui se renouvelle chaque année. Ceux-ci sont encadrés par une professionnelle qui travaille avec des conseillers scientifiques.
OBNL, DataFranca bénéficie de certaines subventions et du soutien de Google AI, du Mila ou encore du CRIM. La seule façon de rentabiliser ses activités serait de vendre une licence au gouvernement québécois pour ses fonctionnaires, ce qui n’est pas (encore) gagné. Le lexique se veut évolutif, mais le vocabulaire de base demeure le même. Ainsi, ChatGPT (que Gérard Pelletier prononce en français) a été inclus dans le lexique. « Nous restons à l’affût et nous continuons à l’enrichir, ajoute-t-il. Nous ne tirons pas le livre à 50 000 exemplaires, mais nous planifions le rééditer. Quand je vais dans des salons, les gens réagissent de façon tout à fait remarquable. Nous sommes là pour diffuser la connaissance, c’est le mandat de DataFranca ! » Ce n’est sans doute pas pour rien que le scientifique en chef Rémy Quirion a accepté de signer la préface de la première édition du livre. Et l’éditeur espère bien qu’il récidivera pour les éditions subséquentes.
Gérard Pelletier a commencé des discussions avec l’Agence universitaire de la Francophonie afin d’offrir gratuitement le livre aux universités francophones des pays en développement. L’organisme compte plus de 1000 universités, grandes écoles, réseaux universitaires et centres de recherche scientifique utilisant la langue française dans 115 pays. En comparaison, l’Organisation internationale de la Francophonie compte 88 États et gouvernements. « Nous avons eu une première rencontre et l’intérêt y est. Je vais d’ailleurs à Paris en juin pour faire avancer le dossier. »