Navigare
AI BENCHY
Your ad here

AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Google: Gemini 2.5 Flash

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-24

Metrică DeepSeek V4 Pro DeepSeek V4 Pro high Lansare: 2026-04-24 Gemini 2.5 Flash Gemini 2.5 Flash medium Lansare: 2025-06-17
Scor 8.2 8.2
Rang #20 #17
Fiabilitate N/D N/D
Consistență 9.6 9.5
Teste corecte
Rată de trecere pe încercare 74.1% 75.9%
Teste instabile 1 1
Rulări totale 24 54
Cost per rezultat 1.224 2.454
Cost total $0.160 $0.319
Preț de intrare $1.740 / 1M $0.300 / 1M
Preț de ieșire $3.480 / 1M $2.500 / 1M
Tokenuri de ieșire 671 1,898
Tokenuri de raționament 39,383 122,273
Timp de răspuns (mediu) 71.21s 12.12s
Timp de răspuns (maxim) 351.99s 95.48s
Timp de răspuns (total) 1281.73s 218.12s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Pro 8.3 10.0 75.0% 0 26.93s 70 2,008
Gemini 2.5 Flash 8.4 10.0 75.0% 0 6.30s 255 10,233
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Pro 10.0 10.0 100.0% 0 93.00s 82 2,808
Gemini 2.5 Flash 10.0 10.0 100.0% 0 16.23s 522 10,350
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Pro 10.0 10.0 100.0% 0 71.08s 134 2,163
Gemini 2.5 Flash 10.0 10.0 100.0% 0 28.44s 303 11,922
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Pro 10.0 10.0 100.0% 0 63.00s 67 1,071
Gemini 2.5 Flash 10.0 10.0 100.0% 0 4.06s 279 2,325
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Pro 5.3 10.0 33.3% 0 202.56s 11 25,343
Gemini 2.5 Flash 5.9 7.2 55.6% 1 37.34s 18 80,702
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Pro 5.0 10.0 0.0% 0 26.96s 51 734
Gemini 2.5 Flash 4.8 10.0 0.0% 0 4.86s 92 1,899
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Pro 10.0 10.0 100.0% 0 14.60s 21 1,236
Gemini 2.5 Flash 9.8 10.0 100.0% 0 2.62s 69 1,203
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Pro 7.6 7.4 77.8% 1 69.69s 151 3,847
Gemini 2.5 Flash 7.7 10.0 66.7% 0 3.94s 126 2,499
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Pro 10.0 10.0 100.0% 0 11.05s 84 173
Gemini 2.5 Flash 10.0 10.0 100.0% 0 6.20s 234 1,140

Comparație rapidă

Schimbă perechea de comparație