DataFranca
DataFranca a pour mission de promouvoir l’utilisation d’une terminologie française commune dans les domaines de l’intelligence artificielle et des sciences connexes à travers l’espace francophone. Grâce à une contribution financière de l’Office québécois de la langue française et en collaboration avec Google Brain, DataFranca mettra en place le premier grand Lexique français en sciences des données, intelligence artificielle et apprentissage profond.
Le projet comprend une plateforme collaborative en ligne de type Wiki universel destinée à documenter, normaliser et diffuser en français les termes et concepts soumis par une communauté d’utilisateurs experts et de terminologues.
Déjà bien implanté dans l’espace anglophone mondial, le corpus des sciences des données, avec son vocabulaire et sa syntaxe, n’a pas encore d’équivalent français normalisé et exhaustif pour décrire l’ensemble des termes et concepts associés aux disciplines de la quatrième révolution industrielle.
Face au développement fulgurant des nouvelles sciences, il y a lieu d’agir avec célérité pour nous assurer que le fruit des programmes de recherche en intelligence artificielle puisse être partagé et enseigné pareillement dans les établissements de langue française.
Le grand Lexique français répondra à un besoin de plus en plus évoqué dans le monde de l’enseignement : celui de posséder un vocabulaire commun pour exprimer en français la morphologie, la syntaxe et les concepts des sciences des données.
Modèle de collaboration
Votre collaboration avec DataFranca consiste à inviter des membres de votre réseau à prendre connaissance du projet et à participer à la réalisation du grand Lexique français des sciences des données, de l’intelligence artificielle et de l’apprentissage profond.
Chacun sera sollicité pour proposer des termes existants dans sa propre banque linguistique ou recommander des adaptations qui rendent le mieux en français la signification des termes et concepts issus de l’anglais. Des modérateurs recueilleront les termes suggérés pour réaliser un lexique normalisé.
Objectifs du projet
DataFranca se donne pour mission de promouvoir l’utilisation et la diffusion d’une terminologie française commune dans le domaine de l’intelligence artificielle et des sciences émergentes pour les secteurs de la recherche, de l’enseignement et de la formation en entreprise. À terme, une application en intelligence artificie lle sera développée pour adapter (traduire) les thèses, articles et autres documents volumineux de l’anglais au français et du fr ançais à l’anglais.
Pour ce faire, DataFranca crée un réseau international de collaboration continue qui regroupe les grands acteurs du domaine (chercheurs et spécialistes) afin de réaliser le premier grand lexique français en intelligence artificielle, sciences des données et apprentissage profond. DataFranca vise à faire du français la lingua franca, la langue véhiculaire commune de l’intelligence artificielle dans le vaste espace culturel francophone d’Europe, d’Amérique, d’Afrique et d’Asie.
Conception et planification
• Analyser le contexte universitaire et professionnel tant au Canada qu’à l’international.
• Identifier les principales sources de contenus, tels les sites d’universités et d’entreprises.
• Identifier et assembler les termes et les concepts utilisés dans les sciences de données, l’intelligence artificielle et l’apprentissage profond; identifier les capsules linguistiques et vidéos pertinentes et adaptables en français.
Extrants visés
(moyens d’action ciblés)
• Un portail favorisera les échanges, les commentaires et les suggestions.
• Le site de DataFranca et Le grand
dictionnaire terminologique diffuseront les équivalences proposées, après une validation rigoureuse auprès des pairs,
des terminologues et autres spécialistes de la langue française.
• Un mécanisme de communication soutenue reliera les intervenants de ces domaines préoccupés par le dévelop-pement d’un glossaire linguistique spécialisé.
• Au fur et à mesure que se réalisera ce travail d’adaptation, nous amorcerons la diffusion de la terminologie par Wikipédia et Wiktionnaire, sources
importantes d’information pour les travailleurs. Nous utiliserons aussi les réseaux sociaux (Twitter, Google+, Facebook), et plus particulièrement LinkedIn où se retrouvent la plupart des travailleurs actifs dans le domaine.