IBM présente Granite 3.2 : Un avancement majeur dans l’IA

IBM dévoile son dernier développement dans la série de modèles de langage Granite avec la sortie de Granite 3.2. Ce modèle met l’accent sur l’apport d’améliorations de raisonnement grâce à une technique innovante nommée chaîne de pensée (CoT). En permettant aux modèles de découper des problèmes complexes en étapes logiques, Granite 3.2 vise à imiter les processus de raisonnement humain.

Qu’est-ce que la Chaîne de Pensée (CoT) ?

La méthode CoT se distingue des approches d’apprentissage par renforcement traditionnelles, car elle permet d’améliorer la performance de raisonnement sans compromettre l’efficacité des tâches générales. Par exemple, lorsque l’on pose une question comme « Pourquoi le ciel est-il bleu ? », Granite 3.2 utilise CoT pour construire une réponse cohérente en définissant d’abord ce qu’est la couleur bleue, puis en expliquant le phénomène de la lumière et de l’atmosphère. Cette capacité de raisonnement est particulièrement utile pour les tâches nécessitant un raisonnement multi-étapes, des calculs ou des prises de décision complexes.

Cette fonction CoT est intégrée dans les versions 8B et 2B de Granite, permettant aux développeurs de l’activer ou non selon la complexité de la tâche. Cela signifie que les entreprises peuvent optimiser l’utilisation de leurs ressources computationnelles.

Innovations dans la Compréhension Documentaire

Une autre nouveauté apportée par IBM est le modèle linguistique basé sur la vision (VLM), conçu spécifiquement pour améliorer la compréhension des documents. En utilisant l’outil Docling en open source, IBM a traité 85 millions de PDF pour créer 26 millions de paires question-réponse synthétiques, renforçant ainsi la capacité de Granite à gérer des flux de travail complexes axés sur des documents.

Engagement pour la Sécurité

IBM reste résolue à aborder les préoccupations de sécurité en présentant Granite Guardian 3.2, qui améliore la détection des risques dans les prompts et les réponses tout en réduisant la taille du modèle de 30 %. Cette mise à jour introduit également une nouvelle fonctionnalité de « confiance verbalisée » pour une évaluation des risques plus nuancée.

Prévisions Avancées

Les modèles de prévision TinyTimeMixers permettent désormais des prévisions à long terme pouvant aller jusqu’à deux ans. Cela représente un atout majeur pour les entreprises dans des domaines tels que la finance, l’économie et la gestion de la chaîne d’approvisionnement.

Open Source et Accessibilité

Tous les modèles de Granite 3.2 sont disponibles sous licence Apache 2.0 sur des plateformes comme Hugging Face, WatsonX.ai, et Ollama. Cette stratégie d’ouverture d’IBM vise à rendre l’IA plus accessible et économique pour les entreprises.

Dans un avenir où l’efficacité, l’intégration et l’impact réel deviennent cruciaux pour les entreprises, Granite 3.2 se positionne comme un acteur clé dans l’évolution de solutions d’intelligence artificielle. Sriram Raghavan, VP recherche IA chez IBM, souligne que la prochaine ère de l’IA se concentre sur des résultats puissants sans coûts computationnels excessifs.

Pour plus d’informations, consultez l’article original sur ZDNet.