AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.7 Max

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-05-22

Metrik	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Veröffentlichung: 2026-03-03	Qwen3.7 Max Qwen3.7 Max medium Veröffentlichung: 2026-05-22

Metrik	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Veröffentlichung: 2026-03-03	Qwen3.7 Max Qwen3.7 Max medium Veröffentlichung: 2026-05-22
Punktzahl	7.5	9.0
Rang	#50	#5
Zuverlässigkeit	10.0	10.0
Konsistenz	9.7	9.6
Korrekte Tests
Erfolgsquote pro Versuch	63.3%	88.3%
Instabile Tests	1	1
Gesamtläufe	60	60
Kosten pro Ergebnis	0.140	5.540
Gesamtkosten	$0.017	$0.942
Eingabepreis	$0.250 / 1M	$2.500 / 1M
Ausgabepreis	$1.500 / 1M	$7.500 / 1M
Ausgabe-Token	5,394	2,109
Denk-Token	0	110,285
Antwortzeit (Durchschnitt)	1.24s	13.83s
Antwortzeit (Maximum)	3.39s	33.37s
Antwortzeit (Gesamt)	24.89s	276.53s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	7.5	8.4	66.7%	1		1.04s	1,092	0
Qwen3.7 Max	10.0	10.0	100.0%	0		6.36s	222	8,742

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	6.8	10.0	50.0%	0		1.06s	664	0
Qwen3.7 Max	10.0	10.0	100.0%	0		22.98s	403	22,134

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		3.20s	339	0
Qwen3.7 Max	10.0	10.0	100.0%	0		19.60s	366	8,405

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.22s	399	0
Qwen3.7 Max	10.0	10.0	100.0%	0		8.80s	270	6,254

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		942ms	568	0
Qwen3.7 Max	5.9	7.2	55.6%	1		24.94s	61	31,793

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		741ms	69	0
Qwen3.7 Max	10.0	10.0	100.0%	0		11.70s	135	4,457

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.13s	574	0
Qwen3.7 Max	10.0	10.0	100.0%	0		7.46s	102	5,452

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		972ms	898	0
Qwen3.7 Max	10.0	10.0	100.0%	0		8.84s	259	8,908

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.39s	782	0
Qwen3.7 Max	10.0	10.0	100.0%	0		6.63s	267	1,220

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		814ms	9	0
Qwen3.7 Max	3.0	10.0	0.0%	0		33.37s	24	12,920

Schnellvergleich

Vergleichspaar wechseln

Gemini 3.1 Flash Lite PreviewnonevsGLM 5.1medium Gemini 3.1 Flash Lite PreviewnonevsKimi K2.6medium DeepSeek V4 FlashhighKostenlos verfügbarvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-Flashmedium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.2medium Gemini 3.1 Flash Lite PreviewnonevsStep 3.5 Flashmedium Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewnonevsQwen3.6 Flashmedium Gemini 3.5 FlashnonevsQwen3.7 Maxmedium Gemini 3.1 Flash Lite PreviewnonevsGLM 5V Turbomedium Gemini 3.1 Flash Lite PreviewnonevsGrok Build 0.1medium Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2-Promedium