AI BENCHY Compare

Google: Gemma 4 31B vs MoonshotAI: Kimi K2.6

Résumé

Comparaison benchmark Gemma 4 31B vs Kimi K2.6 : Gemma 4 31B mène au score moyen avec 6.1 vs 5.8. Gemma 4 31B a le coût de benchmark le plus bas avec $0.004 vs $0.079. Gemma 4 31B est plus rapide avec 4.05s vs 13.27s, avec des taux de réussite de 47.6% vs 36.5%.

Modèle recommandé: Gemma 4 31B - Il obtient le meilleur score ici (6.1) tout en coûtant environ 26.1x moins que Kimi K2.6.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-18

Métrique	Gemma 4 31B Gemma 4 31B none Sortie: 2026-04-02 Disponible gratuitement	Kimi K2.6 Kimi K2.6 none Sortie: 2026-04-20 Disponible gratuitement

Métrique	Gemma 4 31B Gemma 4 31B none Sortie: 2026-04-02 Disponible gratuitement	Kimi K2.6 Kimi K2.6 none Sortie: 2026-04-20 Disponible gratuitement
Score	6.1	5.8
Rang	#98	#111
Fiabilité	10.0	10.0
Cohérence	10.0	9.2
Tests corrects
Taux de réussite par tentative	47.6%	36.5%
Tests instables	0	2
Exécutions totales	63	63
Coût par résultat	0.034	1.267
Coût total	$0.004	$0.079
Prix d'entrée	$0.120 / 1M	$0.680 / 1M
Prix de sortie	$0.350 / 1M	$3.410 / 1M
Total des jetons d'entrée	20,911	32,916
Jetons de sortie	1,407	16,410
Jetons de raisonnement	0	0
Temps de réponse (moy.)	4.05s	13.27s
Temps de réponse (max)	26.13s	238.89s
Temps de réponse (total)	76.87s	278.57s

Génération showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#98 Gemma 4 31B

none

Coût: $0.001
Temps: 12.8s
Tokens: 795 tok

#111 MoonshotAI: Kimi K2.6

none

Coût: $0.020
Temps: 127.4s
Tokens: 4,429 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	6.5	10.0	50.0%	0		1.85s	852	45	0
Kimi K2.6	4.6	10.0	25.0%	0		1.39s	618	471	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	5.5	10.0	33.3%	0		11.19s	8,381	735	0
Kimi K2.6	5.5	9.8	33.3%	0		82.57s	5,986	14,754	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	3.0	10.0	0.0%	0		0ms	0	0	0
Kimi K2.6	3.0	10.0	0.0%	0		3.38s	11,269	290	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	10.0	10.0	100.0%	0		2.25s	8,352	285	0
Kimi K2.6	10.0	10.0	100.0%	0		1.32s	7,014	201	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	7.7	10.0	66.7%	0		3.22s	903	27	0
Kimi K2.6	5.3	7.2	44.4%	1		1.48s	732	42	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	10.0	10.0	100.0%	0		2.09s	576	117	0
Kimi K2.6	5.4	3.5	33.3%	1		1.55s	477	138	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	6.5	10.0	50.0%	0		2.84s	795	78	0
Kimi K2.6	6.5	10.0	50.0%	0		1.64s	669	72	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	6.5	10.0	33.3%	0		4.23s	828	108	0
Kimi K2.6	3.1	9.9	0.0%	0		1.40s	651	185	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	3.0	10.0	0.0%	0		0ms	0	0	0
Kimi K2.6	10.0	10.0	100.0%	0		4.46s	5,286	240	0

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Gemma 4 31B	3.0	10.0	0.0%	0		1.25s	224	12	0
Kimi K2.6	3.0	10.0	0.0%	0		1.36s	214	17	0

Comparaison rapide

Changer la paire de comparaison