« AudioPaLM » : différence entre les versions
(Page créée avec « ==en construction== == Définition == XXXXXXXXX == Français == ''' AudioPaLM''' == Anglais == ''' AudioPaLM''' '''Abstract.''' We introduce AudioPaLM, a large langu... ») |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
== | == Définition == | ||
AudioPaLM est un modèle de langage pour la compréhension et la génération de la parole. Il fusionne les modèles de langage basés sur le texte et la parole, PaLM-2 [Anil et al., 2023] et AudioLM [Borsos et al., 2022], en une architecture multimodale unifiée qui peut traiter et générer du texte et de la parole avec des applications de reconnaissance vocale. | |||
== Français == | == Français == | ||
''' AudioPaLM''' | '''AudioPaLM''' | ||
== Anglais == | == Anglais == | ||
''' AudioPaLM''' | '''AudioPaLM''' | ||
<small> | <small> | ||
Ligne 16 : | Ligne 13 : | ||
[https://google-research.github.io/seanet/audiopalm/examples/ Source : google-research] | [https://google-research.github.io/seanet/audiopalm/examples/ Source : google-research] | ||
[[Catégorie: | [[Catégorie:publication]] |
Version du 25 septembre 2023 à 16:35
Définition
AudioPaLM est un modèle de langage pour la compréhension et la génération de la parole. Il fusionne les modèles de langage basés sur le texte et la parole, PaLM-2 [Anil et al., 2023] et AudioLM [Borsos et al., 2022], en une architecture multimodale unifiée qui peut traiter et générer du texte et de la parole avec des applications de reconnaissance vocale.
Français
AudioPaLM
Anglais
AudioPaLM
Contributeurs: Maya Pentsch, wiki