« Large Language and Vision Assistant » : différence entre les versions


(Page créée avec « == en construction == == Définition == xxxxx == Français == ''' XXXXXX''' == Anglais == ''' LLaVA''' ''' Large Language and Vision Assistant''' ==Sources== [https://arxiv.org/abs/2304.08485 Source : arxiv ] Catégorie:vocabulary »)
 
Aucun résumé des modifications
Ligne 2 : Ligne 2 :


== Définition ==
== Définition ==
xxxxx
LLaVa (Large Language and Vision Assistant) est un modèle multimodal de grande taille à libre-d'accès qui appartient à la catégorie des grands modèles de langues et qui améliore les capacités de reconnaissance et de réponses aux questions portant sur des images. Il offre une réponse plus complète que GPT-4, mais il présente également des limites sur le plan sémantique.
 
Voir aussi '''[[grand modèle de langues]]'''


== Français ==
== Français ==
Ligne 10 : Ligne 12 :
''' LLaVA'''
''' LLaVA'''


''' Large Language and Vision Assistant'''
''' large language and vision assistant'''


''LLaVa (Large Language and Vision Assistant) is an open-source large multi-modal model belonging to Large Language Models and enhances capabilities for recognizing and answering questions about images. It offers more comprehensive response than GPT-4 but it also has limitation with semantic.''


==Sources==
==Sources==
[https://arxiv.org/abs/2304.08485  Source : arxiv ]
[https://arxiv.org/abs/2304.08485  Source : arxiv ]
[https://medium.com/@sulaiman.shamasna/large-language-and-vision-assistant-llava-v1-6-vs-v1-5-ede06b81ab48  Source : Medium]




[[Catégorie:vocabulary]]
[[Catégorie:vocabulary]]

Version du 14 octobre 2024 à 16:03

en construction

Définition

LLaVa (Large Language and Vision Assistant) est un modèle multimodal de grande taille à libre-d'accès qui appartient à la catégorie des grands modèles de langues et qui améliore les capacités de reconnaissance et de réponses aux questions portant sur des images. Il offre une réponse plus complète que GPT-4, mais il présente également des limites sur le plan sémantique.

Voir aussi grand modèle de langues

Français

XXXXXX

Anglais

LLaVA

large language and vision assistant

LLaVa (Large Language and Vision Assistant) is an open-source large multi-modal model belonging to Large Language Models and enhances capabilities for recognizing and answering questions about images. It offers more comprehensive response than GPT-4 but it also has limitation with semantic.

Sources

Source : arxiv

Source : Medium

Contributeurs: Arianne , wiki