AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs xAI: Grok 4.3

Résumé

Comparaison benchmark GPT-5.2 Chat vs Grok 4.3 : GPT-5.2 Chat mène au score moyen avec 8.5 vs 7.7. GPT-5.2 Chat a le coût de benchmark le plus bas avec $0.393 vs $0.614. GPT-5.2 Chat est plus rapide avec 7.13s vs 47.51s, avec des taux de réussite de 74.6% vs 71.4%.

Modèle recommandé: GPT-5.2 Chat - Il obtient le meilleur score ici (8.5) tout en coûtant environ 1.6x moins que Grok 4.3.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-12

Métrique	GPT-5.2 Chat GPT-5.2 Chat none Sortie: 2025-12-11	Grok 4.3 Grok 4.3 medium Sortie: 2026-05-01

Métrique	GPT-5.2 Chat GPT-5.2 Chat none Sortie: 2025-12-11	Grok 4.3 Grok 4.3 medium Sortie: 2026-05-01
Score	8.5	7.7
Rang	#22	#40
Fiabilité	10.0	10.0
Cohérence	8.9	8.5
Tests corrects
Taux de réussite par tentative	74.6%	71.4%
Tests instables	3	4
Exécutions totales	63	63
Coût par résultat	2.803	4.724
Coût total	$0.393	$0.614
Prix d'entrée	$1.750 / 1M	$1.250 / 1M
Prix de sortie	$14.000 / 1M	$2.500 / 1M
Total des jetons d'entrée	34,212	44,472
Jetons de sortie	23,744	1,981
Jetons de raisonnement	0	221,382
Temps de réponse (moy.)	7.13s	47.51s
Temps de réponse (max)	38.52s	216.69s
Temps de réponse (total)	149.69s	997.68s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#22 GPT-5.2 Chat

none

Cost: $0.010
Time: 15.3s
Tokens: 797 tok

#40 xAI: Grok 4.3

medium

Cost: $0.009
Time: 19.0s
Tokens: 3,661 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
GPT-5.2 Chat	8.7	7.9	91.7%	1		3.40s	606	1,807	0
Grok 4.3	10.0	10.0	100.0%	0		8.83s	2,010	88	8,207

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
GPT-5.2 Chat	8.8	7.8	88.9%	1		9.82s	7,305	6,731	0
Grok 4.3	5.9	7.7	44.4%	1		41.23s	8,340	1,028	31,226

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
GPT-5.2 Chat	10.0	10.0	100.0%	0		9.12s	11,019	1,243	0
Grok 4.3	10.0	10.0	100.0%	0		63.99s	12,909	234	15,301

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
GPT-5.2 Chat	10.0	10.0	100.0%	0		3.05s	7,140	980	0
Grok 4.3	10.0	10.0	100.0%	0		18.97s	7,761	180	9,546

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
GPT-5.2 Chat	5.3	10.0	33.3%	0		17.78s	723	7,810	0
Grok 4.3	5.3	7.2	44.4%	1		181.74s	1,764	14	111,300

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
GPT-5.2 Chat	4.4	3.0	33.3%	1		3.20s	477	335	0
Grok 4.3	5.4	2.5	66.7%	1		24.70s	825	70	5,020

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
GPT-5.2 Chat	9.8	10.0	100.0%	0		5.51s	660	1,441	0
Grok 4.3	9.8	10.0	100.0%	0		18.58s	1,362	57	8,713

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
GPT-5.2 Chat	7.7	10.0	66.7%	0		4.10s	642	1,603	0
Grok 4.3	5.9	7.2	55.6%	1		22.52s	1,689	128	14,468

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
GPT-5.2 Chat	10.0	10.0	100.0%	0		4.68s	5,445	555	0
Grok 4.3	10.0	10.0	100.0%	0		17.66s	7,263	168	4,615

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
GPT-5.2 Chat	3.0	10.0	0.0%	0		6.89s	195	1,239	0
Grok 4.3	3.0	10.0	0.0%	0		44.47s	549	14	12,986

Comparaison rapide

Changer la paire de comparaison

Seed-2.0-LitemediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsStep 3.7 Flashmedium Step 3.7 FlashlowvsGrok 4.3medium GPT-5.2 ChatnonevsGLM 5medium GPT-5.2 ChatnonevsGLM 5 Turbomedium GPT-5.3 ChatnonevsGrok 4.3medium DeepSeek V4 FlashhighvsGPT-5.2 Chatnone Claude Opus 4.7mediumvsGPT-5.2 Chatnone Gemini 2.5 FlashmediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsQwen3.7 Plusmedium Gemini 3 Flash PreviewlowvsGrok 4.3medium Claude Opus 4.8mediumvsGPT-5.2 Chatnone