AI BENCHY
Compară
❤️ Made by XCS
Your ad here

Nume model

Google: Gemini 3 Flash Preview

Raționament (low)

Benchmark-urile au fost generate din suitele de teste AI BENCHY la : 24 feb. 2026

Metrică Google: Gemini 3 Flash Preview
Rang#5
CompanieGoogle
Score 8.23
Consistență 8.71
Cost per rezultat 0.6173
Cost total $0.06174
Teste corecte
Rată de trecere pe încercare 82.0%
Teste instabile 2
Tokenuri de ieșire 936
Tokenuri de raționament 18,071
Timp de răspuns (medie)6746ms
Timp de răspuns (total)87697ms
Timp de răspuns (maxim)14717ms

Defalcare pe categorii

Categorie Teste trecute complet Score Consistență Rată de trecere pe încercare Teste instabile Scor de raționament Timp de răspuns (medie) Cost
Trucuri anti-AI 10.00 10.00 100.0% 0 6.23 3496ms $0.00844
Parsare și extragere de date 10.00 10.00 100.0% 0 4.73 9460ms $0.01354
Specific domeniului 4.00 4.41 55.5% 2 1.83 8314ms $0.01993
Respectarea instrucțiunilor 7.50 9.99 50.0% 0 5.00 7016ms $0.00878
Puzzle Solving 10.00 10.00 100.0% 0 7.50 6440ms $0.01105

Modele comparate

Compară Google: Gemini 3 Flash Preview cu...

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Raționament (medium)

Score: 8.54

Consistență: 9.35

Rată de trecere pe încercare: 87.2%

Teste instabile: 1

Cost per rezultat: 2.1621

Teste corecte:

Cost total: $0.23784

Compară

#6 · OpenAI

OpenAI: GPT-5.3-Codex

Raționament (medium)

Score: 7.77

Consistență: 8.75

Rată de trecere pe încercare: 76.9%

Teste instabile: 2

Cost per rezultat: 4.9342

Teste corecte:

Cost total: $0.44408

Compară

#3 · Google

Google: Gemini 3 Pro Preview

Raționament (medium)

Score: 8.54

Consistență: 10.00

Rată de trecere pe încercare: 84.6%

Teste instabile: 0

Cost per rezultat: 0.7901

Teste corecte:

Cost total: $0.08692

Compară

Comparație rapidă

Compară Google: Gemini 3 Flash Preview cu...