Leaderboard AI Benchy

Name: Résultats de benchmark des modèles AI BENCHY
Creator: AI BENCHY
License: https://aibenchy.com/methodology/

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-07-24 Modèles évalués: 222

222/222

Rang	Modèle	Score	Entreprise	Coût total	Temps de réponse (moy.)
#109#109	Qwen3.5-27Bnone	6.5	Qwen	$0.058 ↓	4.76s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 14 Fiabilité 10.0 Taux de réussite par tentative 40.9% Tests instables 2 Jetons d'entrée 102,316 Jetons de sortie 24,321 Jetons de raisonnement 0 Temps de réponse (moy.) 4.76s Temps de réponse (total) 104.71s Temps de réponse (max) 69.46s Mauvaise réponse: 12 N'a pas suivi les instructions: 2 Astuces anti-IA : 4.8 Programmation : 5.8 Combiné : 6.4 Analyse et extraction des données : 10.0 Spécifique au domaine : 3.0 Intelligence générale : 5.0 Suivi des instructions : 6.3 Résolution d'énigmes : 6.7 Appel d'outils : 10.0 Culture générale : 3.0
#110#110	Gemini 3.1 Flash Lite Previewlow	6.5	Google	$0.646	16.70s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 9 Fiabilité 10.0 Taux de réussite par tentative 59.1% Tests instables 0 Jetons d'entrée 110,185 Jetons de sortie 14,717 Jetons de raisonnement 397,483 Temps de réponse (moy.) 16.70s Temps de réponse (total) 367.47s Temps de réponse (max) 309.35s Mauvaise réponse: 7 N'a pas suivi les instructions: 1 Appel d'outil invalide: 1 Astuces anti-IA : 8.3 Programmation : 5.5 Combiné : 3.0 Analyse et extraction des données : 10.0 Spécifique au domaine : 5.3 Intelligence générale : 4.0 Suivi des instructions : 10.0 Résolution d'énigmes : 10.0 Appel d'outils : 10.0 Culture générale : 3.0
#111#111	Gemini 3.1 Flash Litelow	6.5	Google	$0.621	16.26s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 10 Fiabilité 10.0 Taux de réussite par tentative 59.1% Tests instables 2 Jetons d'entrée 94,224 Jetons de sortie 7,759 Jetons de raisonnement 390,126 Temps de réponse (moy.) 16.26s Temps de réponse (total) 357.64s Temps de réponse (max) 318.02s Mauvaise réponse: 9 Appel d'outil invalide: 1 Astuces anti-IA : 7.3 Programmation : 5.5 Combiné : 3.2 Analyse et extraction des données : 10.0 Spécifique au domaine : 5.3 Intelligence générale : 4.0 Suivi des instructions : 10.0 Résolution d'énigmes : 10.0 Appel d'outils : 10.0 Culture générale : 3.0
#112#112	Gemini 3.1 Flash Lite Previewnone	6.4	Google	$0.052	1.58s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 10 Fiabilité 10.0 Taux de réussite par tentative 57.6% Tests instables 1 Jetons d'entrée 120,942 Jetons de sortie 14,292 Jetons de raisonnement 0 Temps de réponse (moy.) 1.58s Temps de réponse (total) 34.72s Temps de réponse (max) 9.27s Mauvaise réponse: 7 N'a pas suivi les instructions: 2 Aucune réponse: 1 Astuces anti-IA : 7.5 Programmation : 5.5 Combiné : 3.0 Analyse et extraction des données : 10.0 Spécifique au domaine : 5.3 Intelligence générale : 4.0 Suivi des instructions : 10.0 Résolution d'énigmes : 10.0 Appel d'outils : 10.0 Culture générale : 3.0
#113#113	Qwen3.5 Plus 2026-02-15none	6.4	Qwen	$0.073 ↓	9.85s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 12 Fiabilité 10.0 Taux de réussite par tentative 48.5% Tests instables 2 Jetons d'entrée 102,646 Jetons de sortie 29,370 Jetons de raisonnement 0 Temps de réponse (moy.) 9.85s Temps de réponse (total) 157.63s Temps de réponse (max) 123.00s Mauvaise réponse: 12 Astuces anti-IA : 4.8 Programmation : 4.3 Combiné : 6.5 Analyse et extraction des données : 10.0 Spécifique au domaine : 5.3 Intelligence générale : 4.4 Suivi des instructions : 10.0 Résolution d'énigmes : 7.7 Appel d'outils : 10.0 Culture générale : 3.0
#115#115	Ring-2.6-1Tmedium	6.3	Inclusionai	$0.103 ↑	68.74s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 11 Fiabilité 10.0 Taux de réussite par tentative 60.6% Tests instables 4 Jetons d'entrée 113,604 Jetons de sortie 123,079 Jetons de raisonnement 42,754 Temps de réponse (moy.) 68.74s Temps de réponse (total) 1374.86s Temps de réponse (max) 304.19s Mauvaise réponse: 6 Erreur API: 2 N'a pas suivi les instructions: 2 Appel d'outil invalide: 1 Astuces anti-IA : 10.0 Programmation : 5.3 Combiné : 7.3 Analyse et extraction des données : 6.5 Spécifique au domaine : 3.5 Intelligence générale : 4.1 Suivi des instructions : 9.8 Résolution d'énigmes : 5.9 Appel d'outils : 10.0 Culture générale : 3.0
#117#117	Gemma 4 31Bmedium	6.3	Google	$0.102 ↓	75.38s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 8 Fiabilité 10.0 Taux de réussite par tentative 68.2% Tests instables 2 Jetons d'entrée 94,992 Jetons de sortie 34,468 Jetons de raisonnement 223,278 Temps de réponse (moy.) 75.38s Temps de réponse (total) 1507.52s Temps de réponse (max) 437.40s Erreur API: 2 Délai dépassé: 2 Mauvaise réponse: 2 Appel d'outil invalide: 1 Aucune réponse: 1 Astuces anti-IA : 10.0 Programmation : 4.3 Combiné : 2.9 Analyse et extraction des données : 10.0 Spécifique au domaine : 7.7 Intelligence générale : 10.0 Suivi des instructions : 10.0 Résolution d'énigmes : 9.9 Appel d'outils : 3.0 Culture générale : 3.0
#118#118	LongCat 2.0none	6.3	Meituan	$0.044	5.18s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 15 Fiabilité 10.0 Taux de réussite par tentative 36.4% Tests instables 2 Jetons d'entrée 108,743 Jetons de sortie 9,372 Jetons de raisonnement 0 Temps de réponse (moy.) 5.18s Temps de réponse (total) 113.95s Temps de réponse (max) 48.38s Mauvaise réponse: 14 Mise en forme supplémentaire: 1 Astuces anti-IA : 4.8 Programmation : 5.5 Combiné : 6.5 Analyse et extraction des données : 10.0 Spécifique au domaine : 3.0 Intelligence générale : 5.0 Suivi des instructions : 6.5 Résolution d'énigmes : 4.0 Appel d'outils : 10.0 Culture générale : 3.0
#119#119	Claude Sonnet 5none	6.3	Anthropic	$0.548	6.04s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 14 Fiabilité 10.0 Taux de réussite par tentative 45.5% Tests instables 4 Jetons d'entrée 161,035 Jetons de sortie 22,511 Jetons de raisonnement 0 Temps de réponse (moy.) 6.04s Temps de réponse (total) 132.85s Temps de réponse (max) 33.39s Mauvaise réponse: 7 Mise en forme supplémentaire: 4 Aucune réponse: 2 N'a pas suivi les instructions: 1 Astuces anti-IA : 5.3 Programmation : 4.6 Combiné : 6.5 Analyse et extraction des données : 10.0 Spécifique au domaine : 5.3 Intelligence générale : 4.7 Suivi des instructions : 6.4 Résolution d'énigmes : 6.0 Appel d'outils : 10.0 Culture générale : 3.0
#120#120	MiMo-V2-Flashmedium	6.3	Xiaomi	$0.043 ↑	20.11s
Voir la fiche du modèle Tests totaux 21 Tests incorrects 9 Fiabilité 10.0 Taux de réussite par tentative 62.1% Tests instables 3 Jetons d'entrée 40,111 Jetons de sortie 12,476 Jetons de raisonnement 125,039 Temps de réponse (moy.) 20.11s Temps de réponse (total) 301.59s Temps de réponse (max) 96.01s Mauvaise réponse: 5 Erreur API: 1 Mise en forme supplémentaire: 1 N'a pas suivi les instructions: 1 Délai dépassé: 1 Astuces anti-IA : 8.1 Programmation : 6.0 Combiné : 4.9 Analyse et extraction des données : 6.5 Spécifique au domaine : 5.9 Intelligence générale : 4.0 Suivi des instructions : 10.0 Résolution d'énigmes : 7.7 Appel d'outils : 10.0 Culture générale : 3.0
#121#121	Qwen3.5-Flashmedium	6.2	Qwen	$0.139 ↓	84.82s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 10 Fiabilité 10.0 Taux de réussite par tentative 69.7% Tests instables 6 Jetons d'entrée 118,499 Jetons de sortie 12,284 Jetons de raisonnement 490,610 Temps de réponse (moy.) 84.82s Temps de réponse (total) 1781.22s Temps de réponse (max) 515.38s Mauvaise réponse: 4 Délai dépassé: 3 Erreur API: 1 N'a pas suivi les instructions: 1 Appel d'outil invalide: 1 Astuces anti-IA : 10.0 Programmation : 3.7 Combiné : 6.4 Analyse et extraction des données : 7.3 Spécifique au domaine : 5.3 Intelligence générale : 6.1 Suivi des instructions : 10.0 Résolution d'énigmes : 8.2 Appel d'outils : 10.0 Culture générale : 3.0
#122#122	Gemma 4 31Bnone	6.2	Google	$0.020 ↓	5.34s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 12 Fiabilité 10.0 Taux de réussite par tentative 48.5% Tests instables 1 Jetons d'entrée 125,728 Jetons de sortie 13,317 Jetons de raisonnement 0 Temps de réponse (moy.) 5.34s Temps de réponse (total) 106.82s Temps de réponse (max) 29.95s Mauvaise réponse: 9 Erreur API: 2 N'a pas suivi les instructions: 1 Astuces anti-IA : 6.5 Programmation : 5.5 Combiné : 3.8 Analyse et extraction des données : 10.0 Spécifique au domaine : 7.7 Intelligence générale : 10.0 Suivi des instructions : 6.5 Résolution d'énigmes : 6.5 Appel d'outils : 3.0 Culture générale : 3.0
#123#123	Seed-2.0-Litenone	6.2	Bytedance Seed	$0.066	4.40s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 14 Fiabilité 10.0 Taux de réussite par tentative 43.9% Tests instables 4 Jetons d'entrée 142,197 Jetons de sortie 14,746 Jetons de raisonnement 0 Temps de réponse (moy.) 4.40s Temps de réponse (total) 96.84s Temps de réponse (max) 44.58s Mauvaise réponse: 13 Aucune réponse: 1 Astuces anti-IA : 3.0 Programmation : 5.6 Combiné : 3.0 Analyse et extraction des données : 10.0 Spécifique au domaine : 3.6 Intelligence générale : 10.0 Suivi des instructions : 10.0 Résolution d'énigmes : 5.3 Appel d'outils : 10.0 Culture générale : 3.0
#124#124	GPT-5.6 Lunalow	6.2	OpenAI	$0.249	5.04s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 12 Fiabilité 10.0 Taux de réussite par tentative 56.1% Tests instables 5 Jetons d'entrée 96,346 Jetons de sortie 8,211 Jetons de raisonnement 17,227 Temps de réponse (moy.) 5.04s Temps de réponse (total) 110.88s Temps de réponse (max) 19.44s Mauvaise réponse: 10 N'a pas suivi les instructions: 1 Appel d'outil invalide: 1 Astuces anti-IA : 8.3 Programmation : 5.5 Combiné : 2.8 Analyse et extraction des données : 10.0 Spécifique au domaine : 3.6 Intelligence générale : 5.0 Suivi des instructions : 8.5 Résolution d'énigmes : 7.6 Appel d'outils : 10.0 Culture générale : 3.0
#125#125	Gemini 2.5 Flashnone	6.2	Google	$0.017	6.20s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 13 Fiabilité 10.0 Taux de réussite par tentative 43.9% Tests instables 1 Jetons d'entrée 39,877 Jetons de sortie 1,890 Jetons de raisonnement 0 Temps de réponse (moy.) 6.20s Temps de réponse (total) 136.37s Temps de réponse (max) 118.00s Mauvaise réponse: 12 Appel d'outil invalide: 1 Astuces anti-IA : 3.0 Programmation : 5.5 Combiné : 3.0 Analyse et extraction des données : 10.0 Spécifique au domaine : 5.9 Intelligence générale : 5.0 Suivi des instructions : 10.0 Résolution d'énigmes : 7.7 Appel d'outils : 10.0 Culture générale : 3.0
#126#126	Qwen3.5-35B-A3Bmedium	6.2	Qwen	$0.837 ↓	112.47s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 11 Fiabilité 10.0 Taux de réussite par tentative 66.7% Tests instables 6 Jetons d'entrée 130,388 Jetons de sortie 40,630 Jetons de raisonnement 786,040 Temps de réponse (moy.) 112.47s Temps de réponse (total) 2474.28s Temps de réponse (max) 950.25s Délai dépassé: 5 Aucune réponse: 2 Mauvaise réponse: 2 Erreur API: 1 Appel d'outil invalide: 1 Astuces anti-IA : 10.0 Programmation : 5.9 Combiné : 3.8 Analyse et extraction des données : 7.3 Spécifique au domaine : 4.1 Intelligence générale : 2.8 Suivi des instructions : 10.0 Résolution d'énigmes : 8.2 Appel d'outils : 10.0 Culture générale : 3.0
#127#127	Gemini 3.1 Flash Liteminimal	6.1	Google	$0.047	1.86s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 12 Fiabilité 10.0 Taux de réussite par tentative 51.5% Tests instables 3 Jetons d'entrée 119,065 Jetons de sortie 11,118 Jetons de raisonnement 0 Temps de réponse (moy.) 1.86s Temps de réponse (total) 40.88s Temps de réponse (max) 12.97s Mauvaise réponse: 8 N'a pas suivi les instructions: 3 Aucune réponse: 1 Astuces anti-IA : 8.3 Programmation : 5.5 Combiné : 3.0 Analyse et extraction des données : 10.0 Spécifique au domaine : 2.9 Intelligence générale : 4.0 Suivi des instructions : 10.0 Résolution d'énigmes : 6.0 Appel d'outils : 10.0 Culture générale : 3.0
#128#128	gpt-oss-120bmedium	6.1	OpenAI	$0.019 ↓	21.91s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 13 Fiabilité 10.0 Taux de réussite par tentative 50.0% Tests instables 5 Jetons d'entrée 108,747 Jetons de sortie 29,772 Jetons de raisonnement 68,044 Temps de réponse (moy.) 21.91s Temps de réponse (total) 328.70s Temps de réponse (max) 68.16s Mauvaise réponse: 9 N'a pas suivi les instructions: 3 Appel d'outil invalide: 1 Astuces anti-IA : 6.7 Programmation : 5.9 Combiné : 6.5 Analyse et extraction des données : 6.4 Spécifique au domaine : 2.9 Intelligence générale : 4.3 Suivi des instructions : 9.9 Résolution d'énigmes : 5.3 Appel d'outils : 9.8 Culture générale : 3.0
#129#129	Gemini 3.1 Flash Litenone	6.1	Google	$0.046	1.75s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 13 Fiabilité 10.0 Taux de réussite par tentative 50.0% Tests instables 4 Jetons d'entrée 118,050 Jetons de sortie 10,723 Jetons de raisonnement 0 Temps de réponse (moy.) 1.75s Temps de réponse (total) 38.60s Temps de réponse (max) 16.25s Mauvaise réponse: 11 N'a pas suivi les instructions: 1 Aucune réponse: 1 Astuces anti-IA : 7.5 Programmation : 5.5 Combiné : 3.0 Analyse et extraction des données : 10.0 Spécifique au domaine : 2.9 Intelligence générale : 4.0 Suivi des instructions : 10.0 Résolution d'énigmes : 6.3 Appel d'outils : 10.0 Culture générale : 3.0
#131#131	Qwen3.6 Flashnone	6.1	Qwen	$0.062 ↓	3.74s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 15 Fiabilité 10.0 Taux de réussite par tentative 34.9% Tests instables 1 Jetons d'entrée 139,788 Jetons de sortie 30,947 Jetons de raisonnement 0 Temps de réponse (moy.) 3.74s Temps de réponse (total) 82.38s Temps de réponse (max) 48.79s Mauvaise réponse: 12 Appel d'outil invalide: 2 N'a pas suivi les instructions: 1 Astuces anti-IA : 3.1 Programmation : 5.4 Combiné : 3.8 Analyse et extraction des données : 10.0 Spécifique au domaine : 5.3 Intelligence générale : 10.0 Suivi des instructions : 6.3 Résolution d'énigmes : 3.5 Appel d'outils : 10.0 Culture générale : 3.0
#132#132	Qwen3.5-Flashnone	6.1	Qwen	$0.073 ↓	25.28s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 14 Fiabilité 10.0 Taux de réussite par tentative 39.4% Tests instables 2 Jetons d'entrée 282,347 Jetons de sortie 209,201 Jetons de raisonnement 0 Temps de réponse (moy.) 25.28s Temps de réponse (total) 556.24s Temps de réponse (max) 480.96s Mauvaise réponse: 13 Appel d'outil invalide: 1 Astuces anti-IA : 3.5 Programmation : 5.5 Combiné : 2.9 Analyse et extraction des données : 10.0 Spécifique au domaine : 7.7 Intelligence générale : 10.0 Suivi des instructions : 6.3 Résolution d'énigmes : 3.1 Appel d'outils : 10.0 Culture générale : 3.0
#133#133	Qwen3.5 Plus 2026-04-20none	6.1	Qwen	$0.122 ↓	13.56s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 14 Fiabilité 10.0 Taux de réussite par tentative 43.9% Tests instables 4 Jetons d'entrée 94,468 Jetons de sortie 51,487 Jetons de raisonnement 0 Temps de réponse (moy.) 13.56s Temps de réponse (total) 298.31s Temps de réponse (max) 206.05s Mauvaise réponse: 12 N'a pas suivi les instructions: 2 Astuces anti-IA : 4.8 Programmation : 3.9 Combiné : 6.4 Analyse et extraction des données : 10.0 Spécifique au domaine : 5.3 Intelligence générale : 4.8 Suivi des instructions : 6.2 Résolution d'énigmes : 6.7 Appel d'outils : 10.0 Culture générale : 3.0
#134#134	Qwen3.5-35B-A3Bnone	6.1	Qwen	$0.106 ↓	12.72s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 15 Fiabilité 10.0 Taux de réussite par tentative 43.9% Tests instables 4 Jetons d'entrée 134,521 Jetons de sortie 86,614 Jetons de raisonnement 0 Temps de réponse (moy.) 12.72s Temps de réponse (total) 279.90s Temps de réponse (max) 209.15s Mauvaise réponse: 12 N'a pas suivi les instructions: 2 Appel d'outil invalide: 1 Astuces anti-IA : 3.4 Programmation : 5.5 Combiné : 3.8 Analyse et extraction des données : 10.0 Spécifique au domaine : 7.7 Intelligence générale : 6.5 Suivi des instructions : 6.3 Résolution d'énigmes : 3.7 Appel d'outils : 10.0 Culture générale : 3.0
#135#135	GPT-5 Nanomedium	6.1	OpenAI	$0.114	54.87s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 13 Fiabilité 10.0 Taux de réussite par tentative 56.1% Tests instables 8 Jetons d'entrée 94,935 Jetons de sortie 12,042 Jetons de raisonnement 261,056 Temps de réponse (moy.) 54.87s Temps de réponse (total) 822.99s Temps de réponse (max) 227.89s Mauvaise réponse: 9 N'a pas suivi les instructions: 2 Aucune réponse: 1 Délai dépassé: 1 Astuces anti-IA : 6.5 Programmation : 7.0 Combiné : 6.4 Analyse et extraction des données : 3.7 Spécifique au domaine : 5.2 Intelligence générale : 4.1 Suivi des instructions : 9.8 Résolution d'énigmes : 5.3 Appel d'outils : 10.0 Culture générale : 3.0
#136#136	Nemotron 3 Ultranone	6.1	NVIDIA	$0.072 ↕	3.87s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 14 Fiabilité 10.0 Taux de réussite par tentative 42.4% Tests instables 2 Jetons d'entrée 101,275 Jetons de sortie 9,474 Jetons de raisonnement 0 Temps de réponse (moy.) 3.87s Temps de réponse (total) 85.15s Temps de réponse (max) 37.50s Mauvaise réponse: 12 Erreur API: 1 N'a pas suivi les instructions: 1 Astuces anti-IA : 3.5 Programmation : 5.5 Combiné : 3.0 Analyse et extraction des données : 10.0 Spécifique au domaine : 5.3 Intelligence générale : 5.0 Suivi des instructions : 10.0 Résolution d'énigmes : 5.9 Appel d'outils : 10.0 Culture générale : 3.0
#139#139	GPT-5.6 Terranone	6.0	OpenAI	$0.349	1.65s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 14 Fiabilité 10.0 Taux de réussite par tentative 42.4% Tests instables 3 Jetons d'entrée 102,259 Jetons de sortie 6,203 Jetons de raisonnement 0 Temps de réponse (moy.) 1.65s Temps de réponse (total) 36.28s Temps de réponse (max) 10.07s Mauvaise réponse: 11 N'a pas suivi les instructions: 1 Appel d'outil invalide: 1 Aucune réponse: 1 Astuces anti-IA : 4.8 Programmation : 5.5 Combiné : 2.9 Analyse et extraction des données : 10.0 Spécifique au domaine : 5.3 Intelligence générale : 5.0 Suivi des instructions : 8.5 Résolution d'énigmes : 5.3 Appel d'outils : 9.6 Culture générale : 3.0
#141#141	Mimo V2 Omnimedium	5.9	Xiaomi	$0.683 ↓	41.16s
Voir la fiche du modèle Tests totaux 21 Tests incorrects 11 Fiabilité 10.0 Taux de réussite par tentative 53.0% Tests instables 3 Jetons d'entrée 37,007 Jetons de sortie 1,952 Jetons de raisonnement 357,306 Temps de réponse (moy.) 41.16s Temps de réponse (total) 823.26s Temps de réponse (max) 299.23s Mauvaise réponse: 5 N'a pas suivi les instructions: 2 Aucune réponse: 2 Erreur API: 1 Mise en forme supplémentaire: 1 Astuces anti-IA : 10.0 Programmation : 3.3 Combiné : 5.0 Analyse et extraction des données : 10.0 Spécifique au domaine : 3.0 Intelligence générale : 5.4 Suivi des instructions : 8.3 Résolution d'énigmes : 5.9 Appel d'outils : 10.0 Culture générale : 3.0
#142#142	Hy3 previewhigh	5.9	Tencent	$0.048 ↕	56.57s
Voir la fiche du modèle Tests totaux 21 Tests incorrects 10 Fiabilité 10.0 Taux de réussite par tentative 53.0% Tests instables 2 Jetons d'entrée 25,987 Jetons de sortie 216,719 Jetons de raisonnement 0 Temps de réponse (moy.) 56.57s Temps de réponse (total) 848.59s Temps de réponse (max) 149.94s Erreur API: 7 Mauvaise réponse: 3 Astuces anti-IA : 6.4 Programmation : 5.3 Combiné : 5.0 Analyse et extraction des données : 6.5 Spécifique au domaine : 5.3 Intelligence générale : 3.0 Suivi des instructions : 10.0 Résolution d'énigmes : 7.7 Appel d'outils : 10.0 Culture générale : 3.0
#143#143	GPT-5.4 Mininone	5.9	OpenAI	$0.095	1.53s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 16 Fiabilité 10.0 Taux de réussite par tentative 33.3% Tests instables 3 Jetons d'entrée 79,067 Jetons de sortie 7,880 Jetons de raisonnement 0 Temps de réponse (moy.) 1.53s Temps de réponse (total) 33.74s Temps de réponse (max) 9.92s Mauvaise réponse: 13 N'a pas suivi les instructions: 3 Astuces anti-IA : 3.1 Programmation : 5.5 Combiné : 6.5 Analyse et extraction des données : 10.0 Spécifique au domaine : 3.5 Intelligence générale : 4.8 Suivi des instructions : 6.3 Résolution d'énigmes : 5.4 Appel d'outils : 3.0 Culture générale : 3.0
#145#145	Kimi K2.6none	5.8	Moonshot AI	$0.184 ↓	19.58s
Voir la fiche du modèle Tests totaux 22 Tests incorrects 15 Fiabilité 10.0 Taux de réussite par tentative 34.9% Tests instables 2 Jetons d'entrée 116,970 Jetons de sortie 30,253 Jetons de raisonnement 0 Temps de réponse (moy.) 19.58s Temps de réponse (total) 430.85s Temps de réponse (max) 238.89s Mauvaise réponse: 11 N'a pas suivi les instructions: 3 Aucune réponse: 1 Astuces anti-IA : 4.6 Programmation : 5.5 Combiné : 3.0 Analyse et extraction des données : 10.0 Spécifique au domaine : 5.3 Intelligence générale : 5.4 Suivi des instructions : 6.5 Résolution d'énigmes : 3.1 Appel d'outils : 10.0 Culture générale : 3.0

←

1 3 4 5 8

→

Comparaison rapide

Gemini 3.6 FlashmediumvsGemini 3.6 Flashhigh Gemini 3.6 FlashhighvsGemini 3 Flash Previewmedium Gemini 3 Flash PreviewmediumvsGemini 3.5 Flashhigh Gemini 3.5 FlashhighvsGPT-5.6 Sollow GPT-5.6 SollowvsGemini 3.6 Flashlow Gemini 3.6 FlashlowvsGPT-5.6 Solmedium GPT-5.6 SolmediumvsGPT-5.6 Solhigh GPT-5.6 SolhighvsGPT-5.5low GPT-5.5lowvsGemini 3.1 Pro Previewmedium Gemini 3.1 Pro PreviewmediumvsQwen3.7 Maxmedium Qwen3.7 MaxmediumvsGemini 3.5 Flashmedium Gemini 3.5 FlashmediumvsGPT-5.5medium

Leaderboard AI Benchy

Filtrer les modèles

Comparaison rapide