Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Google: Gemini 3.1 Flash Lite

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-08

Metrică DeepSeek V4 Pro DeepSeek V4 Pro high Lansare: 2026-04-24 Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Lansare: 2026-05-08
Scor 6.9 6.8
Rang #65 #68
Fiabilitate 9.3 10.0
Consistență 8.2 8.7
Teste corecte
Rată de trecere pe încercare 70.2% 59.7%
Teste instabile 4 3
Rulări totale 57 57
Cost per rezultat 1.927 0.111
Cost total $0.212 $0.012
Preț de intrare $0.435 / 1M $0.250 / 1M
Preț de ieșire $0.870 / 1M $1.500 / 1M
Tokenuri de ieșire 12,211 2,457
Tokenuri de raționament 53,774 0
Timp de răspuns (mediu) 58.93s 1.41s
Timp de răspuns (maxim) 358.35s 4.49s
Timp de răspuns (total) 1119.75s 26.72s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Pro 7.4 10.0 75.0% 0 16.53s 71 3,617
Gemini 3.1 Flash Lite 8.3 10.0 75.0% 0 1.10s 639 0
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Pro 2.6 0.0 50.0% 1 51.77s 105 2,641
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.31s 636 0
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Pro 10.0 10.0 100.0% 0 65.02s 465 5,914
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.53s 357 0
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Pro 8.8 10.0 100.0% 0 23.62s 229 1,710
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.04s 279 0
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Pro 3.0 6.9 16.7% 1 205.66s 10,529 28,089
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 1.02s 15 0
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Pro 6.1 3.1 66.7% 1 25.09s 76 1,152
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 791ms 63 0
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Pro 10.0 10.0 100.0% 0 41.16s 205 2,416
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 932ms 72 0
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Pro 7.4 7.2 88.9% 1 34.92s 106 3,835
Gemini 3.1 Flash Lite 6.0 4.6 66.7% 2 2.15s 153 0
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Pro 10.0 10.0 100.0% 0 21.33s 372 593
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 3.51s 234 0
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Pro 3.0 10.0 0.0% 0 39.14s 53 3,807
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 724ms 9 0

Comparație rapidă

Schimbă perechea de comparație