AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs MoonshotAI: Kimi K2.7 Code

Rezumat

Comparație benchmark Gemini 3.1 Flash Lite Preview vs Kimi K2.7 Code: Kimi K2.7 Code conduce la scorul mediu cu 7.0 vs 6.4. Gemini 3.1 Flash Lite Preview are costul de benchmark mai mic, $0.018 vs $0.583. Gemini 3.1 Flash Lite Preview este mai rapid cu 1.21s vs 83.60s, cu rate de reușită de 60.3% vs 66.7%.

Model recomandat: Gemini 3.1 Flash Lite Preview - Scorul rămâne aproape de cel mai bun scor de aici (6.4 vs 7.0) și costă de aproximativ 32.9x mai puțin decât Kimi K2.7 Code.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-18

Metrică	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Lansare: 2026-03-03	Kimi K2.7 Code Kimi K2.7 Code medium Lansare: 2026-06-12

Metrică	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Lansare: 2026-03-03	Kimi K2.7 Code Kimi K2.7 Code medium Lansare: 2026-06-12
Scor	6.4	7.0
Rang	#84	#65
Fiabilitate	10.0	9.2
Consistență	9.7	7.7
Teste corecte
Rată de trecere pe încercare	60.3%	66.7%
Teste instabile	1	6
Rulări totale	63	63
Cost per rezultat	0.148	6.074
Cost total	$0.018	$0.583
Preț de intrare	$0.250 / 1M	$0.740 / 1M
Preț de ieșire	$1.500 / 1M	$3.500 / 1M
Total tokenuri de intrare	37,582	25,991
Tokenuri de ieșire	5,547	80,516
Tokenuri de raționament	0	161,391
Timp de răspuns (mediu)	1.21s	83.60s
Timp de răspuns (maxim)	3.39s	365.80s
Timp de răspuns (total)	25.45s	1671.99s

Prezentare generare

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#84 Gemini 3.1 Flash Lite Preview

none

Cost: $0.003
Timp: 4.7s
Tokenuri: 1,827 tok

#65 MoonshotAI: Kimi K2.7 Code

medium

Cost: $0.025
Timp: 138.0s
Tokenuri: 6,093 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	7.5	8.4	66.7%	1		1.04s	504	1,092	0
Kimi K2.7 Code	7.3	5.8	83.3%	2		11.56s	618	3,048	5,041

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		967ms	8,128	670	0
Kimi K2.7 Code	7.6	7.2	77.8%	1		146.73s	4,650	1,864	25,635

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		3.20s	13,026	339	0
Kimi K2.7 Code	4.7	1.6	66.7%	1		34.83s	11,271	444	3,906

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.22s	7,550	399	0
Kimi K2.7 Code	10.0	10.0	100.0%	0		12.27s	7,014	248	2,569

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		942ms	641	568	0
Kimi K2.7 Code	5.3	7.2	44.4%	1		213.29s	431	55,572	63,639

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		741ms	488	69	0
Kimi K2.7 Code	10.0	10.0	100.0%	0		10.78s	477	1,024	1,071

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.13s	623	574	0
Kimi K2.7 Code	9.9	10.0	100.0%	0		5.39s	669	725	1,232

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		900ms	570	1,045	0
Kimi K2.7 Code	5.9	7.7	44.4%	1		41.00s	651	15,438	17,368

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.39s	5,894	782	0
Kimi K2.7 Code	3.0	10.0	0.0%	0		0ms	0	0	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		814ms	158	9	0
Kimi K2.7 Code	3.0	10.0	0.0%	0		341.76s	210	2,153	40,930

Comparație rapidă

Schimbă perechea de comparație

Gemini 3.5 FlashnonevsKimi K2.7 Codemedium Kimi K2.7 CodemediumvsStep 3.7 Flashhigh Gemini 3 Flash PreviewnonevsKimi K2.7 Codemedium Kimi K2.7 CodemediumvsGLM 5.2none Gemini 3.1 Flash Lite PreviewnonevsNemotron 3 SupermediumDisponibil gratuit Gemini 3.1 Flash Lite PreviewnonevsQwen3.6 27Bmedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-35B-A3Bmedium Kimi K2.7 CodemediumvsQwen3.7 Maxnone Kimi K2.7 CodemediumvsQwen3.7 Plusnone DeepSeek V4 PrononevsKimi K2.7 Codemedium Gemini 3.1 Flash Lite PreviewnonevsStep 3.5 Flashmedium Gemini 3.5 FlashminimalvsKimi K2.7 Codemedium