Moondream 1: un impressionante Visione Language Model di piccole dimensioni

preview_player
Показать описание
🧠 Un test di #moondream1, un Vision Language Model di piccole dimensioni (1.6B) costruito utilizzando SigLIP, Phi-1.5 e il set di dati di training di #LLaVA.

🦾 Nel test uso la camera dello smartphone, e il modello descrive in dettaglio la scena. 

___

#AI #VLM #GenAI #GenerativeAI #IntelligenzaArtificiale