AI BENCHY
Vergleichen
❤️ Made by XCS
Your ad here

Modellname

Google: Gemini 3 Flash Preview

Schlussfolgern (low)

Benchmarks aus AI BENCHY-Test-Suites generiert am : 24.02.2026

Metrik Google: Gemini 3 Flash Preview
Rang#5
UnternehmenGoogle
Score 8.23
Konsistenz 8.71
Kosten pro Ergebnis 0.6173
Gesamtkosten $0.06174
Korrekte Tests
Erfolgsquote pro Versuch 82.0%
Instabile Tests 2
Ausgabe-Token 936
Denk-Token 18,071
Antwortzeit (Durchschnitt)6746ms
Antwortzeit (Gesamt)87697ms
Antwortzeit (Maximum)14717ms

Kategorieaufschlüsselung

Kategorie Vollständig bestandene Tests Score Konsistenz Erfolgsquote pro Versuch Instabile Tests Begründungswert Antwortzeit (Durchschnitt) Kosten
Anti-KI-Tricks 10.00 10.00 100.0% 0 6.23 3496ms $0.00844
Datenanalyse und -extraktion 10.00 10.00 100.0% 0 4.73 9460ms $0.01354
Domänenspezifisch 4.00 4.41 55.5% 2 1.83 8314ms $0.01993
Befolgung von Anweisungen 7.50 9.99 50.0% 0 5.00 7016ms $0.00878
Puzzle Solving 10.00 10.00 100.0% 0 7.50 6440ms $0.01105

Verglichene Modelle

Google: Gemini 3 Flash Preview vergleichen mit...

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Schlussfolgern (medium)

Score: 8.54

Konsistenz: 9.35

Erfolgsquote pro Versuch: 87.2%

Instabile Tests: 1

Kosten pro Ergebnis: 2.1621

Korrekte Tests:

Gesamtkosten: $0.23784

Vergleichen

#6 · OpenAI

OpenAI: GPT-5.3-Codex

Schlussfolgern (medium)

Score: 7.77

Konsistenz: 8.75

Erfolgsquote pro Versuch: 76.9%

Instabile Tests: 2

Kosten pro Ergebnis: 4.9342

Korrekte Tests:

Gesamtkosten: $0.44408

Vergleichen

#3 · Google

Google: Gemini 3 Pro Preview

Schlussfolgern (medium)

Score: 8.54

Konsistenz: 10.00

Erfolgsquote pro Versuch: 84.6%

Instabile Tests: 0

Kosten pro Ergebnis: 0.7901

Korrekte Tests:

Gesamtkosten: $0.08692

Vergleichen

Schnellvergleich

Google: Gemini 3 Flash Preview vergleichen mit...