« AudioPaLM » : différence entre les versions


m (Remplacement de texte : « ↵↵<small> » par « ==Sources== »)
m (Remplacement de texte : « ↵↵==Sources== » par «  ==Sources== »)
 
(2 versions intermédiaires par le même utilisateur non affichées)
Ligne 6 : Ligne 6 :


== Anglais ==
== Anglais ==
'''AudioPaLM'''==Sources==
'''AudioPaLM'''
==Sources==


[https://google-research.github.io/seanet/audiopalm/examples/  Source : google-research]
[https://google-research.github.io/seanet/audiopalm/examples/  Source : google-research]


[[Catégorie:ENGLISH]]
[[Catégorie:ENGLISH]]


[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 30 août 2024 à 14:00

Définition

AudioPaLM est un modèle de langage pour la compréhension et la génération de la parole. Il fusionne les modèles de langage basés sur le texte et la parole, PaLM-2 [Anil et al., 2023] et AudioLM [Borsos et al., 2022], en une architecture multimodale unifiée qui peut traiter et générer du texte et de la parole avec des applications de reconnaissance vocale.

Français

AudioPaLM

Anglais

AudioPaLM

Sources

Source : google-research

Contributeurs: Maya Pentsch, wiki