Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs MoonshotAI: Kimi K2.6

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-22

Metrică Gemini 3.5 Flash Gemini 3.5 Flash minimal Lansare: 2026-05-19 Kimi K2.6 Kimi K2.6 medium Lansare: 2026-04-20
Scor 7.9 7.4
Rang #24 #54
Fiabilitate 10.0 8.3
Consistență 9.6 8.3
Teste corecte
Rată de trecere pe încercare 71.7% 70.8%
Teste instabile 1 4
Rulări totale 60 60
Cost per rezultat 0.734 7.630
Cost total $0.103 $0.916
Preț de intrare $1.500 / 1M $0.730 / 1M
Preț de ieșire $9.000 / 1M $3.490 / 1M
Tokenuri de ieșire 5,271 102,488
Tokenuri de raționament 0 229,389
Timp de răspuns (mediu) 1.58s 54.11s
Timp de răspuns (maxim) 5.51s 215.85s
Timp de răspuns (total) 31.55s 1028.14s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 6.5 10.0 50.0% 0 892ms 405 0
Kimi K2.6 7.0 8.0 66.7% 1 11.59s 7,115 8,934
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 7.0 9.8 50.0% 0 3.39s 3,450 0
Kimi K2.6 6.5 5.3 75.0% 1 118.23s 9,255 52,215
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 3.0 10.0 0.0% 0 3.56s 404 0
Kimi K2.6 10.0 10.0 100.0% 0 40.96s 711 13,876
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.66s 279 0
Kimi K2.6 10.0 10.0 100.0% 0 20.38s 316 11,305
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 899ms 12 0
Kimi K2.6 5.3 7.2 44.4% 1 202.38s 47,035 98,262
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 922ms 117 0
Kimi K2.6 10.0 10.0 100.0% 0 17.83s 3,981 4,472
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 6.4 5.8 66.7% 1 893ms 76 0
Kimi K2.6 10.0 10.0 100.0% 0 12.53s 3,977 5,269
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.45s 282 0
Kimi K2.6 6.0 7.4 55.6% 1 25.59s 14,140 17,868
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.79s 234 0
Kimi K2.6 10.0 10.0 100.0% 0 8.92s 248 1,011
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Gemini 3.5 Flash 3.0 10.0 0.0% 0 1.76s 12 0
Kimi K2.6 3.0 10.0 0.0% 0 130.27s 15,710 16,177

Comparație rapidă

Schimbă perechea de comparație