Intelligence artificielle

Classement des IA : le vote du public compte-t-il plus que les tests officiels ?

Classement des IA : le vote du public compte-t-il plus que les tests officiels ?

Les benchmarks techniques sont-ils vraiment représentatifs de votre usage quotidien de l’IA ? Cette question traverse de plus en plus souvent les discussions sur l’intelligence artificielle. Alors que les laboratoires multiplient les tests sophistiqués pour mesurer les performances des modèles, une autre forme d’évaluation gagne du terrain : le vote direct des utilisateurs.

Humanity’s Last Exam : l’examen qui pousse l’IA dans ses derniers retranchements

Humanity’s Last Exam : l’examen qui pousse l’IA dans ses derniers retranchements

Les modèles d’intelligence artificielle progressent si rapidement qu’ils rendent obsolètes les tests censés mesurer leurs capacités. GPT-4, Claude ou Gemini obtiennent désormais des scores si élevés sur les benchmarks traditionnels que ces évaluations perdent leur pertinence. Face à cette saturation, les chercheurs conçoivent des examens d’un nouveau genre, plus exigeants et plus révélateurs des véritables limites de l’IA.

Traduction en temps réel : la révolution silencieuse qui transforme le monde

Traduction en temps réel : la révolution silencieuse qui transforme le monde

La vidéo dure moins d’une minute. On y voit deux personnes en visioconférence qui conversent naturellement. L’une s’exprime en espagnol, l’autre en anglais. Entre elles, aucun interprète humain, mais Google Translate dans une démonstration de ses capacités futures. La conversation coule, fluide, presque sans accroc. Les voix synthétiques préservent les intonations, les pauses, même certaines hésitations. Cette scène apparemment banale matérialise pourtant un fantasme vieux comme l’humanité : celui d’une communication universelle, immédiate, sans effort d’apprentissage.

Et si le progrès consistait à douter ? L’hypothèse qui bouleverse les modèles de langage

Et si le progrès consistait à douter ? L’hypothèse qui bouleverse les modèles de langage

Dans notre dernier article, nous avons exploré pourquoi les modèles de langage inventent des informations avec une assurance déconcertante. Les hallucinations, avons-nous démontré, ne sont pas des bugs à corriger mais des conséquences directes de leur mode d’apprentissage statistique. Face à ce constat, une question s’impose : si le problème est structurel, la solution ne devrait-elle pas l’être aussi ? Plutôt que de bricoler des correctifs techniques, plusieurs équipes de recherche explorent une piste plus fondamentale : transformer les règles mêmes qui gouvernent l’entraînement de ces systèmes.

Les agents IA autonomes : promesse d’efficacité ou risque mal calibré ?

Les agents IA autonomes : promesse d’efficacité ou risque mal calibré ?

L’intelligence artificielle change de nature. Nous avons appris à dialoguer avec des assistants capables de générer du texte, de répondre à des questions, de synthétiser des documents. Mais une nouvelle catégorie émerge : celle des agents IA autonomes, capables non seulement de comprendre une demande, mais aussi de planifier des actions, d’orchestrer des outils et d’agir sans supervision constante.

L’AI Act européen : ce qui change vraiment pour le secteur tech à partir de 2026

L’AI Act européen : ce qui change vraiment pour le secteur tech à partir de 2026

Dans moins d’un an, le 2 août 2026, l’Europe basculera dans une nouvelle ère réglementaire pour l’intelligence artificielle. Si l’AI Act est entré en vigueur depuis août 2024 et que certaines dispositions s’appliquent déjà, c’est bien en 2026 que la majorité des entreprises tech devront être pleinement conformes. Les systèmes à haut risque, qui constituent le cœur de nombreuses applications professionnelles, seront alors soumis à l’intégralité des obligations prévues par le texte. Voici ce qui attend concrètement le secteur.

Kimi K2 Thinking : l’IA open source chinoise qui bouscule l’ordre établi de l’intelligence artificielle

Kimi K2 Thinking : l’IA open source chinoise qui bouscule l’ordre établi de l’intelligence artificielle

Le 6 novembre 2025, Moonshot AI, une start-up pékinoise valorisée à 3,3 milliards de dollars et soutenue par des géants technologiques chinois comme Alibaba et Tencent, a publié Kimi K2 Thinking, un modèle de langage dont les performances annoncées dépasseraient celles de GPT-5 d’OpenAI et de Sonnet 4.5 d’Anthropic sur plusieurs benchmarks de référence. Cette annonce intervient dans un contexte où la domination américaine sur l’intelligence artificielle générative semblait acquise. Pourtant, avec Kimi K2 Thinking, la Chine ne se contente plus de rattraper son retard : elle revendique désormais une place de premier plan, en adoptant une stratégie d’ouverture qui tranche avec le modèle propriétaire des géants californiens.

Véhicule autonome en 2025 : état des lieux

Véhicule autonome en 2025 : état des lieux

À l’été 2025, Tesla a démarré des tests publics de robotaxi à Austin, au Texas. Une étape attendue depuis des années, mais qui s’accompagne d’une nuance de taille : un superviseur humain reste présent à bord, et il ne s’agit pas encore d’une exploitation commerciale à grande échelle. Cette demi-mesure résume assez bien l’état actuel de la conduite autonome. Entre ambitions technologiques affichées et contraintes réglementaires bien réelles, le secteur avance, mais pas au rythme que les annonces marketing laissaient entrevoir il y a cinq ans.

ChatGPT Atlas : quand OpenAI réinvente l’accès à l’information

ChatGPT Atlas : quand OpenAI réinvente l’accès à l’information

Le 21 octobre 2025, OpenAI a dévoilé ChatGPT Atlas, un navigateur web construit autour de son assistant conversationnel. Cette annonce marque une étape notable dans l’évolution des interfaces numériques : plutôt que d’ajouter une couche d’intelligence artificielle à un navigateur existant, l’entreprise californienne a conçu un outil où l’IA constitue le cœur de l’expérience utilisateur. Trois semaines après son lancement, les premiers retours permettent d’esquisser les contours de ce que pourrait devenir la navigation web dans les années à venir.

Découvrez Radio Mercure - Une nouvelle Radio Web Culturelle | www.radio-mercure.com

Dernières publications