« AudioPaLM » : différence entre les versions
m (Remplacement de texte : « ↵↵<small> » par « ==Sources== ») |
m (Remplacement de texte : « ↵↵==Sources== » par « ==Sources== ») |
||
(2 versions intermédiaires par le même utilisateur non affichées) | |||
Ligne 6 : | Ligne 6 : | ||
== Anglais == | == Anglais == | ||
'''AudioPaLM'''==Sources== | '''AudioPaLM''' | ||
==Sources== | |||
[https://google-research.github.io/seanet/audiopalm/examples/ Source : google-research] | [https://google-research.github.io/seanet/audiopalm/examples/ Source : google-research] | ||
[[Catégorie:ENGLISH]] | [[Catégorie:ENGLISH]] | ||
[[Catégorie:GRAND LEXIQUE FRANÇAIS]] | [[Catégorie:GRAND LEXIQUE FRANÇAIS]] |
Dernière version du 30 août 2024 à 14:00
Définition
AudioPaLM est un modèle de langage pour la compréhension et la génération de la parole. Il fusionne les modèles de langage basés sur le texte et la parole, PaLM-2 [Anil et al., 2023] et AudioLM [Borsos et al., 2022], en une architecture multimodale unifiée qui peut traiter et générer du texte et de la parole avec des applications de reconnaissance vocale.
Français
AudioPaLM
Anglais
AudioPaLM
Sources
Contributeurs: Maya Pentsch, wiki