« Génération automatique d'audio » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
 
(6 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Définition ==
== Définition ==
Branche de l'[[intelligence artificielle]] dont le but est de produire de l'audio (son, musique, voix) à partir de représentations informatisées symboliques, apprises et résultant d'un apprentissage automatique ou hybrides.
Branche de l'[[intelligence artificielle]] dont le but est de produire de l'audio, comme du son, de la musique ou une voix, à partir de représentations informatisées symboliques, apprises (et résultant d'un [[apprentissage automatique]]), ou encore hybrides.


Dans le cas particulier d'un dialogue ou d'une conversation entre une personne et un ordinateur, l'opération consiste à produire ou à modifier des contenus audio, en réponse à une [[requête générative]] faite à un [[grand modèle de langues]] dit [[multimodal|modèle multimodal]].  
Dans le cas particulier d'un dialogue ou d'une conversation entre une personne et un ordinateur, l'opération consiste à produire ou à modifier des contenus audio, en réponse à une [[requête générative]] faite à un [[grand modèle de langues]] dit [[multimodal|modèle multimodal]].  


Voir [[synthèse de la parole]].
Voir aussi [[synthèse de la parole]]


== Compléments ==
== Compléments ==
Ligne 25 : Ligne 25 :


'''AI audio generation / generator'''  
'''AI audio generation / generator'''  
==Sources==
[http://www.linguist.univ-paris-diderot.fr/~danlos/Dossier%20publis/GAT%2700.pdf  Source : Université Paris Diderot ]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:publication]]
[[Catégorie:101]]


== Compléments ==
== Compléments ==
Ligne 50 : Ligne 42 :


==Sources==
==Sources==
[http://www.linguist.univ-paris-diderot.fr/~danlos/Dossier%20publis/GAT%2700.pdf  Source : Université Paris Diderot ]
[https://www.legifrance.gouv.fr/jorf/id/JORFTEXT000050185686  Source : Légifrance]
[https://www.legifrance.gouv.fr/jorf/id/JORFTEXT000050185686  Source : Légifrance]


Ligne 55 : Ligne 50 :


[[Catégorie:101]]
[[Catégorie:101]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 4 février 2025 à 15:04

Définition

Branche de l'intelligence artificielle dont le but est de produire de l'audio, comme du son, de la musique ou une voix, à partir de représentations informatisées symboliques, apprises (et résultant d'un apprentissage automatique), ou encore hybrides.

Dans le cas particulier d'un dialogue ou d'une conversation entre une personne et un ordinateur, l'opération consiste à produire ou à modifier des contenus audio, en réponse à une requête générative faite à un grand modèle de langues dit modèle multimodal.

Voir aussi synthèse de la parole

Compléments

En gros, il existe deux approches pour la génération automatique d'audio : 1) l'approche symbolique à base de règles et de gabarits, et 2) une approche statistique ou par apprentissage automatique où la technologie dominante utilise des modèles de langue dits multimodaux qui sont entraînés sur de vastes corpus audio. Il existe également des générateurs d'audio à technologie hybride qui utilisent les deux approches.

Les modèles multimodaux, associés aux robots conversationnels génératifs comme: ChatGPT, Claude ou Gemini, sont capables de générer à la fois des textes, des images ou de l'audio (voix et éventuellement de la musique).

Français

génération / générateur automatique d'audio

génération / générateur d'audio

synthèse texte-audio

Anglais

automatic audio generation / generator

audio generation / generator

AI audio generation / generator

Compléments

La génération automatique d'audio est notamment employée pour composer des œuvres musicales en imitant un style donné ou pour produire un énoncé oral en imitant une voix particulière.

La génération automatique de l'audio se fait souvent en utilisant un modèle à bruit statistique.

Il ne faut pas confondre avec le concept de transcription automatique de la parole.

Français

génération automatique d'audio

Anglais

AI audio generation

audio generative AI

Sources

Source : Université Paris Diderot

Source : Légifrance

Source : journaldugeek