Avec Gemma 2, Google veut établir de nouvelles normes dans les modèles d’IA

Avec Gemma 2, Google veut établir de nouvelles normes dans les modèles d’IA – .

Google a dévoilé Gemma 2, la dernière version de sa suite de modèles d’IA puissants et efficaces pour les chercheurs et les développeurs. Conçus pour une inférence rapide et économique, ces nouveaux modèles développés par DeepMind établissent de nouvelles normes de performance.

Ce que vous devez vous rappeler :

Gemma 2 surpasse les modèles de taille similaire, y compris le 27B qui rivalise avec des modèles deux fois plus grands que lui.
Cette suite est conçue pour fonctionner efficacement sur les GPU et TPU courants, réduisant ainsi considérablement les coûts de déploiement.
Il est compatible avec les principaux frameworks d’IA et disponible sous une licence commerciale.
Il comprend des avancées en matière de sécurité et des outils pour un développement responsable de l’IA.

Un nouveau modèle standard ouvert axé sur l’efficacité et la performance

Dans sa publication officielle, Google vante les mérites de Gemma 2 qui offrira des performances exceptionnelles avec ses modèles 9B et 27B. Plus précisément, le modèle 27B (27 milliards de paramètres) offre une alternative compétitive aux modèles équivalents plus de deux fois plus grands. De son côté, le modèle 9B (9 milliards de paramètres) surpasse ses concurrents comme le Llama 3 8B, établissant de nouvelles normes de performance pour sa catégorie.

Le modèle 27B est conçu pour fonctionner efficacement en inférence de précision totale sur un seul hôte Google Cloud TPU, un GPU NVIDIA A100 80 Go ou H100 Tensor Core. Cette spécificité pourrait permettre le déploiement d’une IA plus accessible et plus économique.

Optimisé pour des vitesses d’inférence élevées, Gemma 2 est conçu pour travailler avec une grande variété de matérieldes ordinateurs portables aux infrastructures cloud. Il est également possible de le tester avec Google AI Studio ou avec Gemma.cpp sur un CPU local.

Gemma 2 inclura bientôt un modèle de paramètres de 2,6 milliards, pour combler davantage l’écart entre l’accessibilité légère et les performances lourdes.

IA Open Source et développement plus responsable

Notez que Gemma 2 est disponible sous licence « commercialement favorable »offrir aux développeurs et aux chercheurs la possibilité de partager et de commercialiser leurs innovations. Il est compatible avec les principaux frameworks d’IA tels que Hugging Face, JAX, PyTorch et TensorFlow via Keras 3.0, vLLM, Gemma.cpp, Llama.cpp et Ollama. Gemma 2 est également optimisé pour NVIDIA TensioRT-LLM. De plus, à partir du mois prochain, les utilisateurs de Google Cloud pourront facilement déployer et gérer Gemma 2 sur la plateforme de développement Vertex AI.

Google fournit également des ressources aux développeurs pour les aider Construire et déployer l’IA de manière responsabley compris une boîte à outils d’IA générative responsable.

Attention à la sécurité

Google a suivi des processus internes rigoureux pour garantir la sécurité lors de la formation de Gemma 2, y compris des filtres de données de pré-formation et des tests approfondis pour identifier et atténuer les biais et les risques potentiels. Les résultats sont publiés sur de nombreux benchmarks publics relatifs à la sécurité et aux préjudices de représentation.

Selon Google, depuis son lancement initial, Gemma a été téléchargé plus de 10 millions de fois, donnant naissance à d’innombrables projets inspirants. Par exemple, le projet Navarasa a utilisé Gemma pour créer un modèle ancré dans la diversité linguistique de l’Inde.

For Latest Updates Follow us on Google News