AudioPaLM


Révision datée du 30 août 2024 à 15:00 par Pitpitt (discussion | contributions) (Remplacement de texte : « ↵↵==Sources== » par «  ==Sources== »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

AudioPaLM est un modèle de langage pour la compréhension et la génération de la parole. Il fusionne les modèles de langage basés sur le texte et la parole, PaLM-2 [Anil et al., 2023] et AudioLM [Borsos et al., 2022], en une architecture multimodale unifiée qui peut traiter et générer du texte et de la parole avec des applications de reconnaissance vocale.

Français

AudioPaLM

Anglais

AudioPaLM

Sources

Source : google-research

Contributeurs: Maya Pentsch, wiki