besoins. Les modèles comme GPT-4V, OWL-ViT, Kosmos-
2, ou LLaVA ont montré des capacités impressionnantes sur des tâches... d’informations dans un domaine
technique riche et structuré, où les documents visuels jouent un rôle central. Les tâches multimodales... -
Voir cette offre d'emploi