Navigation
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs OpenAI: GPT-5.4

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-06-03

Metrik Gemini 3 Flash Preview Gemini 3 Flash Preview low Veröffentlichung: 2025-12-17 GPT-5.4 GPT-5.4 medium Veröffentlichung: 2026-03-05
Punktzahl 8.6 7.9
Rang #12 #27
Zuverlässigkeit 10.0 10.0
Konsistenz 9.6 8.5
Korrekte Tests
Erfolgsquote pro Versuch 81.7% 75.0%
Instabile Tests 1 4
Gesamtläufe 60 60
Kosten pro Ergebnis 0.658 8.765
Gesamtkosten $0.106 $1.140
Eingabepreis $0.500 / 1M $2.500 / 1M
Ausgabepreis $3.000 / 1M $15.000 / 1M
Gesamte Eingabe-Token 33,766 31,489
Ausgabe-Token 2,070 2,221
Denk-Token 27,348 68,486
Antwortzeit (Durchschnitt) 5.81s 22.31s
Antwortzeit (Maximum) 14.72s 100.41s
Antwortzeit (Gesamt) 116.25s 446.17s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.48s 500 281 3,082
GPT-5.4 8.3 10.0 75.0% 0 4.11s 606 240 1,511
Programmierung Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Gemini 3 Flash Preview 7.3 10.0 50.0% 0 6.66s 5,119 450 6,251
GPT-5.4 8.2 6.7 83.3% 1 54.98s 4,686 412 19,995
Kombiniert Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Gemini 3 Flash Preview 3.0 10.0 0.0% 0 3.27s 12,860 326 0
GPT-5.4 10.0 10.0 100.0% 0 20.57s 11,019 301 3,543
Datenanalyse und -extraktion Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.40s 7,261 279 3,656
GPT-5.4 10.0 10.0 100.0% 0 5.32s 7,140 234 804
Domänenspezifisch Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Gemini 3 Flash Preview 5.3 7.2 44.4% 1 8.05s 645 12 6,410
GPT-5.4 5.3 7.2 44.4% 1 74.27s 619 61 34,748
Allgemeine Intelligenz Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.68s 492 120 981
GPT-5.4 4.7 3.1 33.3% 1 4.92s 477 145 321
Befolgung von Anweisungen Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Gemini 3 Flash Preview 9.9 10.0 100.0% 0 7.02s 621 71 2,752
GPT-5.4 10.0 10.0 100.0% 0 3.11s 660 93 897
Rätsellösen Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.77s 562 288 3,168
GPT-5.4 8.2 7.2 88.9% 1 9.14s 642 441 3,815
Werkzeugaufrufe Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.99s 5,550 234 415
GPT-5.4 10.0 10.0 100.0% 0 13.28s 5,445 264 1,031
Allgemeinwissen Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 2.75s 156 9 633
GPT-5.4 3.0 10.0 0.0% 0 13.95s 195 30 1,821

Schnellvergleich

Vergleichspaar wechseln