OpenI lance deux modèles open source

OpenI lance deux modèles open source

Après plus de cinq ans, OpenII revient pour publier des modèles aux poids ouverts avec le lancement des nouveaux GPT-OS-20B et GPT-OS-20B. Le retour à l’intelligence artificielle open source représente un changement significatif de cours par rapport à la ligne fermée et propriétaire adoptée ces dernières années, en particulier avec l’expansion commerciale de l’API.

Le PDG Sam Altman a déclaré qu’Openai était « du mauvais côté de l’histoire » en ce qui concerne l’open source. Maintenant, avec ce mouvement, il vise à récupérer le terrain à la fois sur le front technique et éthique.

OpenI lance deux modèles open source: les caractéristiques techniques

Les nouveaux modèles se distinguent par l’évolutivité et l’accessibilité.

  • GPT-OS-20B: grand modèle, avec 117 milliards de paramètres au total, conçus pour être effectués sur un seul GPU NVIDIA haut de gamme
  • GPT-OS-20B: modèle plus léger, compatible avec 16 Go d’ordinateur portable de RAM

Les deux sont des modèles open source à compatibles avec les ordinateurs portables de consommation ou le matériel et peuvent être téléchargés à partir de Face Hugging avec la licence AI APACHE 2.0, l’une des plus permissives pour un usage commercial.

Ce que les nouveaux modèles ouverts d’OpenII peuvent faire

Bien qu’ils soient des modèles de texte, donc non autorisés à gérer les images ou l’audio, les modèles GPT-ASS ont des compétences de raisonnement IA intéressantes.

Ils peuvent effectuer des chaînes de pensée (chaîne de thougt), attirer des outils externes tels que des moteurs de recherche ou des interprètes Python, et envoyer des requêtes à des modèles de cloud plus avancés en cas de limites de calcul.

OpenII a conçu ces modèles pour alimenter des agents autonomes et modulaires, bien que certaines fonctions ne soient accessibles qu’en les intégrant avec d’autres modèles fermés.

Différences entre GPT-OS-20B et GPT-OS-20B

En plus de la taille, la principale différence est la capacité de calcul activée pour le jeton. Grâce à l’utilisation du paradigme du mélange de mélange-des experts (MOE), GPT-OS-20B active seulement 5,1 milliards de paramètres pour chaque jeton développé, optimisant l’efficacité.

Le modèle 120b offre des performances légèrement plus élevées que 20B dans la référence, mais les deux ont un bon compromis entre la puissance et l’accessibilité.

Performance des modèles GPT-Sioch dans la référence

Sur les principaux tests publics, les performances des modèles OpenII OpenI sont compétitives:

  • Forces de code (avec outils): GPT-OSS-120B obtient un score de 2622, le 20B s’arrête à 2516. Ils dépassent Deepseek R1 mais n’atteignent pas O3 et O4-MINI
  • Le dernier examen de l’humanité (HLE): GPT-OS-20B obtient 19%, 20B 17,3%, battant Deepseek et Qwen, mais restant sous les normes des modèles fermés OpenII

En comparaison, les modèles AI, le GPT-OSS est positionné en haut parmi les modèles de poids ouvert, mais toujours éloignés des performances les plus fermées de la même OpenAI.

Les performances du modèle ouvert d’OpenI sur lesforces de code. Crédits d’image: Openai
Les performances du modèle ouvert d'OpenI sur lesforces de code. Crédits d'image: Openai
Les performances du modèle ouvert d’OpenI sur lesforces de code. Crédits d’image: Openai

Hallucination Ai Openai: un point faible toujours présent

Une limite évidente est le taux d’hallucination à l’Openai. Les modèles GPT-OST produisent des réponses incorrectes ou inventées dans:

  • 49% des cas (GPT-OSS-120B)
  • 53% des cas (GPT-OS-20B)

Ces valeurs, calculées sur PersonQA, sont au-delà du triple par rapport au modèle O1 (16%) et supérieures à O4-Mini (36%). OpenII justifie le phénomène avec les «connaissances mondiales» mineures des modèles plus petits, tout en adoptant des stratégies avancées après la formation.

Comment les modèles open source d’OpenII ont été formés

Les deux modèles ont été formés avec des techniques similaires à celles utilisées pour la série O:

  • Apprentissage par renforcement à haute compréhension (RLHF)
  • Mixage des experts (MOE)
  • Optimisation sur le GPU Nvidia dans le cluster

L’objectif était de créer des modèles open source AI avec une capacité de raisonnement avancée, adapté aux utilisations professionnelles et personnalisables par les développeurs.

Cependant, OpenI n’a pas publié de données de formation, citant des raisons liées à la sécurité et au droit d’auteur. Un compromis qui différencie ces modèles de propositions vraiment ouvertes telles que celles d’A2 ou d’Eleuthei.

Lisez aussi: Google Lancia Gemini 2.5 Deep Think, le modèle AI qui pense en parallèle

Dans quelle mesure les modèles ouverts d’OpenII sont-ils fiables?

Sur le plan de la sécurité, OpenII a effectué des tests pour vérifier si le GPT-OSS pourrait être bon – à des fins dangereuses, telles qu’elle attaque ou le développement d’armes biologiques. Les résultats indiquent un risque marginal, mais aucun seuil de danger élevé obtenu, pas même avec une optimisation malveillante.

Cela confirme que, bien qu’avec des niveaux d’hallucinctions élevés, les modèles maintiennent un bon équilibre entre le pouvoir et la responsabilité.

Comparaison entre les modèles open source chinois et américain

La libération du GPT-ASS se déroule dans un contexte géopolitique délicat. Le chinois open source du AI, comme Deepseek, Qwen (Alibaba) et Moonshot Ai, vont rapidement du terrain, tandis que Meta a perdu son élan avec sa série Llama.

Le gouvernement américain, avec l’administration Trump, a exhorté les entreprises technologiques américaines à publier plusieurs modèles open source, à promouvoir les valeurs démocratiques et à maintenir le leadership technologique mondial.

Avec ce mouvement, Openai vise à renforcer la présence de modèles à l’ouverture « Made in the USA » et à contraster la montée des contreparties asiatiques.

Lire aussi: GPT-5 arrive en août: tout ce que nous savons jusqu’à présent

Où télécharger les modèles open source d’OpenII

Les modèles GPT-OS-20B et GPT-OS-20B sont disponibles gratuitement sur la face des câlins, avec une documentation complète et une licence Apache 2.0 qui permet une utilisation commerciale sans limites.

Une opportunité précieuse pour les entreprises, les startups et les développeurs indépendants qui souhaitent construire des agents AI, des chatbots, des assistants intelligents ou des outils de raisonnement sur une base puissante et ouverte.