Navigation
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemma 4 31B vs Qwen: Qwen3.5-27B

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-05-19

Metrik Gemma 4 31B Gemma 4 31B medium Veröffentlichung: 2026-04-02 Kostenlos verfügbar Qwen3.5-27B Qwen3.5-27B medium Veröffentlichung: 2026-02-24
Punktzahl 8.2 8.1
Rang #18 #22
Zuverlässigkeit 6.7 10.0
Konsistenz 9.6 8.8
Korrekte Tests
Erfolgsquote pro Versuch 77.2% 77.2%
Instabile Tests 1 3
Gesamtläufe 57 57
Kosten pro Ergebnis 0.158 4.107
Gesamtkosten $0.023 $0.534
Eingabepreis $0.120 / 1M $0.195 / 1M
Ausgabepreis $0.370 / 1M $1.560 / 1M
Ausgabe-Token 14,426 2,531
Denk-Token 37,964 266,183
Antwortzeit (Durchschnitt) 28.72s 54.71s
Antwortzeit (Maximum) 90.14s 163.96s
Antwortzeit (Gesamt) 488.27s 1039.57s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 962 2,046
Qwen3.5-27B 8.7 7.9 91.7% 1 19.75s 569 31,505
Programmierung Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Gemma 4 31B 4.7 1.6 66.7% 1 70.97s 3,166 5,449
Qwen3.5-27B 10.0 10.0 100.0% 0 70.35s 375 19,165
Kombiniert Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Qwen3.5-27B 10.0 10.0 100.0% 0 163.96s 483 9,991
Datenanalyse und -extraktion Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 1,822 2,951
Qwen3.5-27B 10.0 10.0 100.0% 0 30.26s 270 16,150
Domänenspezifisch Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 4,349 8,985
Qwen3.5-27B 5.3 10.0 33.3% 0 79.53s 43 52,368
Allgemeine Intelligenz Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 105 888
Qwen3.5-27B 6.1 3.1 66.7% 1 101.41s 70 23,147
Befolgung von Anweisungen Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 533 2,035
Qwen3.5-27B 10.0 10.0 100.0% 0 19.66s 97 11,638
Rätsellösen Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Gemma 4 31B 9.9 10.0 100.0% 0 27.63s 1,797 5,596
Qwen3.5-27B 8.2 7.7 77.8% 1 64.61s 245 77,213
Werkzeugaufrufe Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Qwen3.5-27B 10.0 10.0 100.0% 0 7.45s 348 1,323
Allgemeinwissen Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 1,692 10,014
Qwen3.5-27B 3.0 10.0 0.0% 0 85.11s 31 23,683

Schnellvergleich

Vergleichspaar wechseln