NVIDIA vient de lâcher une bombe atomique dans le monde de l’IA qui va faire trembler OpenAI et Google !
Le nouveau boss de l’IA open source
NVIDIA a dévoilé NVLM 1.0, une famille de modèles de langage multimodaux qui va mettre une claque à ChatGPT-4. Le plus costaud de la bande, NVLM-D-72B avec ses 72 milliards de paramètres, est un véritable monstre capable de jongler entre texte et images comme un pro.
Mais ce qui rend ce modèle vraiment badass, c’est qu’il est totalement open source ! Fini les systèmes propriétaires jalousement gardés, NVIDIA balance les poids du modèle et promet même de publier le code d’entraînement. C’est la révolution, mes amis !
Des performances de ouf
NVLM-D-72B n’est pas là pour rigoler. Il explose les benchmarks sur les tâches visuelles et textuelles, rivalisant avec les modèles fermés les plus puissants du marché.
Mais le plus dingue, c’est que contrairement à d’autres modèles multimodaux qui perdent en performances sur le texte, NVLM-D-72B s’améliore de 4,3 points en moyenne sur les benchmarks textuels après son entraînement multimodal. C’est comme avoir un processeur qui deviendrait plus rapide en ajoutant une carte graphique !
Une architecture de ouf
Les ingénieurs de NVIDIA n’ont pas fait les choses à moitié. Ils ont concocté une architecture hybride qui combine différentes techniques de traitement multimodal. C’est comme mixer les meilleurs ingrédients pour créer le burger ultime de l’IA !
Une IA pour tous
En rendant ce modèle open source, NVIDIA vient de donner un coup de boost monumental à la recherche en IA. Fini le temps où seules les grosses boîtes pouvaient jouer dans la cour des grands. Maintenant, même le dev dans son garage peut potentiellement créer la prochaine révolution de l’IA !
Alors, prêts à bidouiller avec NVLM 1.0 ? L’avenir de l’IA open source est arrivé, et il a un accent vert fluo !