• Studer.IA
  • Posts
  • Newsletter IA #63 du 12 Décembre 2025

Newsletter IA #63 du 12 Décembre 2025

SOMMAIRE

1. Poetiq dépasse Gemini 3 Pro sur ARC-AGI-2
2. Mistral dévoile Devstral 2 et Vibe CLI 
3. OpenAI lance GPT-5.2 et progresse sur les benchmarks
4. OpenAI publie le State of Enterprise AI 
5. Microsoft analyse 37,5 millions d’usages Copilot
6. États-Unis vs Europe : IA militaire, régulation, DMA
7. GPUs, Nvidia, contre-bande, restrictions export
8. Actus en bref : OpenAI, Google, Meta, wearables, on-device AI

Hello 👋

Cette semaine, l’actualité de l’IA se lit en trois temps.
D’abord, les modèles progressent très vite : Poetiq, Mistral et OpenAI montrent que les performances continuent de grimper.
Ensuite, l’IA entre vraiment dans le travail quotidien, avec des usages concrets en entreprise chez OpenAI et Microsoft.
Enfin, le sujet des puces et du matériel devient central : contrôle des GPUs, tensions entre pays, décisions politiques.
En clair : l’IA n’est plus seulement une question de modèles, mais de déploiement, d’usage et de pouvoir.

⚒️ L’outil de la semaine : Leexi

Vous souhaitez transformer vos appels commerciaux en un véritable levier de performance ? Leexi utilise l’intelligence artificielle pour analyser, transcrire et optimiser chaque conversation. Un allié précieux pour gagner en efficacité, comprendre ses prospects et améliorer ses taux de conversion.

Pourquoi Leexi fait la différence :

  • Transcriptions automatiques et fiables

  • Analyse détaillée des conversations

  • Insights concrets pour booster vos performances commerciales

  • Idéal pour toutes les équipes cherchant à optimiser la communication et les performances commerciales

🥇 Modèles de la semaine

Poetiq dépasse Gemini sur ARC-AGI 2

Sur le benchmark ARC-AGI-2, Poetiq atteint le meilleur score vérifié en raisonnement abstrait, devant Gemini 3 Pro, tout en maintenant un coût par tâche compétitif.

Le résumé
La startup française Poetiq a battu le modèle Gemini 3 Pro de Google sur le benchmark ARC-AGI 2, qui évalue le raisonnement abstrait des IA. Elle y parvient sans modifier les poids du modèle, grâce à une ingénierie fine du contexte.

Les détails clés

  • Score obtenu : 92,5 %, contre 90,8 % pour Gemini 3 Pro

  • Technique : prompt engineering avancé + context crafting, sans fine-tuning

  • Modèle utilisé : Gemini 3 Pro en accès API public

  • Objectif : montrer que la valeur ajoutée vient aussi de l'orchestration autour du LLM

  • La méthode sera documentée et réplicable, selon Poetiq

Ce qu’il faut retenir
Poetiq illustre le potentiel de l’innovation à la périphérie des modèles : le contexte, les prompts et l’architecture d’usage deviennent aussi stratégiques que le modèle lui-même.

Mistral dévoile Devstral 2 et Vibe CLI

Sur SWE-Bench Verified, Devstral 2 (Mistral) démontre que les modèles open-weight rivalisent désormais avec les meilleurs modèles propriétaires sur la résolution de bugs réels.

Le résumé
Mistral lance Devstral 2, une nouvelle version de ses modèles dédiés au code, accompagnée de Vibe CLI, un agent autonome en ligne de commande. Une incursion dans le territoire des agents intelligents pour développeurs.

Les détails clés

  • Devstral 2 propose des capacités de raisonnement améliorées pour le code

  • Compatible avec OpenWeight, fidèle à la stratégie open de Mistral

  • Vibe CLI automatise des tâches de codage et debugging

  • Objectif : faciliter l’adoption en entreprise en misant sur l’autonomie de l’IA

  • Le produit est encore expérimental mais marque un changement de posture chez Mistral

Ce qu’il faut retenir
Mistral ne se contente plus de publier des modèles : elle entre dans l’arène des interfaces et agents IA, un pas crucial vers les usages professionnels à grande échelle.

OpenAI dévoile GPT-5.2 et sa progression sur ARC-AGI

Le résumé
OpenAI a annoncé la sortie de GPT-5.2, une mise à jour qui progresse sensiblement sur les benchmarks, notamment ARC-AGI, où les scores ont doublé en un an. La nouvelle version améliore aussi les performances sur des tâches complexes comme SWE-Bench.

Les détails clés

  • GPT-5.2 atteint 85,2 % sur ARC-AGI 2 (contre 37,7 % pour GPT-4 il y a un an)

  • Meilleur score sur SWE-Bench Pro, benchmark de résolution de bugs logiciels

  • Nouvelles capacités d’inférence multi-hop et meilleure persistance contextuelle

  • Sam Altman évoque un « progrès de type humain » dans certains raisonnements

  • Pas encore de déploiement large annoncé dans ChatGPT

Ce qu’il faut retenir
La progression fulgurante d’OpenAI en 12 mois sur les tests de raisonnement général confirme l’accélération de la course aux LLMs. La barre se relève à chaque version.

🕵🏻‍♂️ Étude des usages & adoption (OpenAI & Microsoft)

OpenAI dévoile son premier rapport sur l’usage pro de l’IA

Le résumé
OpenAI publie son tout premier “State of Enterprise AI”, basé sur plus d’1 million de comptes professionnels. Le rapport met en lumière des gains de productivité massifs et l’émergence de nouveaux cas d’usage en entreprise.

Les détails clés

  • 90 % des utilisateurs pros déclarent que l’IA leur fait gagner du temps

  • Les fonctions les plus utilisées : rédaction, synthèse, brainstorming, planification

  • Hausse significative de l’usage d’outils sur mesure (Custom GPTs)

  • Les équipes produits, data et juridique sont parmi les plus actives

  • L’adoption reste plus rapide dans les grandes entreprises tech que dans les PME

Ce qu’il faut retenir
L’usage professionnel de l’IA se structure autour de tâches quotidiennes à fort levier. OpenAI veut s’imposer comme le copilote de référence dans les entreprises.

Microsoft analyse 37 millions d’interactions avec Copilot

Le graphique suit le Rang Moyen (Average Rank) de 10 catégories de Sujets / Intentions (Topic / Intent) différentes, de Janvier à Septembre.

Le résumé
Microsoft publie une étude fondée sur 37,5 millions de conversations Copilot, offrant une vision concrète de la façon dont l’IA est utilisée au quotidien par les professionnels, selon les contextes, les outils et les moments de la journée.

Les détails clés

  • Étude basée sur 37,5M d’interactions Copilot sur 12 mois

  • Les usages principaux concernent la rédaction, la recherche et l’analyse

  • Les pics d’utilisation apparaissent en début de journée et après le déjeuner

  • Sur mobile, les requêtes sont plus courtes et orientées action immédiate

  • Près d’un quart des usages portent sur la synthèse de réunions Teams

  • Ces données guident les évolutions produit et UX à venir

Ce qu’il faut retenir
À l’image d’OpenAI, Microsoft montre que la valeur de l’IA en entreprise ne se joue plus sur la prouesse technique, mais sur son intégration fine dans les flux de travail réels.

🛡️ 2 salles, 2 ambiances : États-Unis vs Europe

Le résumé
Alors que les États-Unis annoncent une nouvelle plateforme d’IA militaire propulsée par Google, l’Union européenne lance une enquête contre le même acteur pour pratiques jugées problématiques sur son moteur de recherche dopé à l’IA.

Les détails clés

  • Le War Department américain lance GenAI.mil, une plateforme d’intelligence artificielle dédiée aux applications militaires.

  • Le premier modèle activé est Gemini de Google, marquant une collaboration public-privé sur un domaine ultra-sensible.

  • L’Union européenne, de son côté, ouvre une enquête sur Google pour usage non autorisé de contenus issus du web et de vidéos dans son système d’IA générative pour la recherche.

  • L’enquête s’appuie sur le règlement sur les marchés numériques (DMA), qui impose des conditions strictes aux grandes plateformes.

Ce qu’il faut retenir
Entre militarisation de l’IA d’un côté et sur-régulation algorithmique de l’autre, la fracture transatlantique sur l’encadrement de l’IA se creuse posant la question de la souveraineté technologique autant que celle de la gouvernance éthique.

🤫 Une chute en 3 étapes 

🇺🇸 Le Département de la Justice américain (DOJ) a arrêté deux hommes accusés d’avoir dirigé un réseau de contrebande de puces Nvidia vers la Chine. En tout, plus de 50 millions de dollars de GPU auraient été saisis.
🔗 Lire l’article

🇨🇳 En parallèle, la startup chinoise DeepSeek préparerait un nouveau modèle d’IA en s’appuyant sur… des puces Nvidia obtenues illégalement, selon une enquête de The Information.
🔗 Lire l’enquête

🔄 Et pour boucler la boucle, l’ancien président Donald Trump vient d’approuver la vente des puces H200 de Nvidia à la Chine… en échange de 25 % de revenus. Une volte-face stratégique majeure.
🔗 Lire la déclaration

📌 Actus en bref

  • OpenAI désactive ses suggestions shopping après des critiques sur leur aspect trop publicitaire. Le CRO Mark Chen reconnaît un déploiement raté.

  •  OpenAI x Instacart : lancement d’une intégration e-commerce pour acheter ses courses directement depuis ChatGPT.

  • Google annonce des lunettes connectées IA pour 2026, en partenariat avec Samsung, Warby Parker et Gentle Monster pour concurrencer Meta.

  • Core Devices lance l’Index 01 : une bague vocale AI à $75 qui transforme vos idées parlées en notes/actions sans cloud ni abonnement.

  • Meta rachète Limitless, la startup de pendentifs IA fondée par Sam Altman, pour transcrire les conversations du quotidien.

La Team Studeria

C’est tout pour cette semaine.

Studeria décrypte l’IA chaque semaine pour vous aider à comprendre ses usages, ses limites et ses opportunités.

Si cette newsletter vous a plu, partagez-la à 2 amis pour leur permettre de rester à jour sur l’IA !