Gemini 3.5 Flash (minimal) vs Qwen3.7 Plus (medium)

Empfohlenes Modell Qwen3.7 Plus (medium)

Es hat die stärkste Punktzahl in diesem Vergleich (7.9) und die beste Gesamtbalance aus Kosten und Antwortzeit über alle 2 Modelle.

Detaillierter Vergleich

Metrik	Gemini 3.5 Flash Gemini 3.5 Flash minimal Veröffentlichung: 2026-05-19	Qwen3.7 Plus Qwen3.7 Plus medium Veröffentlichung: 2026-06-03

Metrik	Gemini 3.5 Flash Gemini 3.5 Flash minimal Veröffentlichung: 2026-05-19	Qwen3.7 Plus Qwen3.7 Plus medium Veröffentlichung: 2026-06-03
Punktzahl	6.8	7.9
Rang	#99	#43
Zuverlässigkeit	10.0	10.0
Konsistenz	9.6	8.9
Korrekte Tests
Erfolgsquote pro Versuch	65.2%	75.8%
Instabile Tests	1	3
Gesamtläufe	66	66
Kosten pro Ergebnis	2.138	2.072
Gesamtkosten	$0.300	$0.267
Eingabepreis	$1.500 / 1M	$0.320 / 1M
Ausgabepreis	$9.000 / 1M	$1.280 / 1M
Gesamte Eingabe-Token	100,753	115,233
Ausgabe-Token	16,454	6,162
Denk-Token	0	173,267
Antwortzeit (Durchschnitt)	2.65s	51.51s
Antwortzeit (Maximum)	25.26s	315.30s
Antwortzeit (Gesamt)	58.27s	1133.15s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

minimal

medium

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	6.5	10.0	50.0%	0		892ms	492	405	0
Qwen3.7 Plus	10.0	10.0	100.0%	0		8.58s	672	195	5,065

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	5.6	9.9	33.3%	0		2.75s	8,122	3,456	0
Qwen3.7 Plus	6.1	6.6	55.6%	1		108.60s	6,472	414	43,576

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	3.0	10.0	0.0%	0		14.41s	76,686	11,581	0
Qwen3.7 Plus	8.2	6.9	66.7%	1		190.27s	89,228	4,403	57,645

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.66s	7,548	279	0
Qwen3.7 Plus	10.0	10.0	100.0%	0		21.75s	7,782	270	6,713

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	10.0	10.0	100.0%	0		899ms	633	12	0
Qwen3.7 Plus	3.6	7.2	22.2%	1		45.35s	771	57	27,073

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	10.0	10.0	100.0%	0		922ms	486	117	0
Qwen3.7 Plus	10.0	10.0	100.0%	0		25.48s	516	123	3,998

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	6.4	5.8	66.7%	1		893ms	615	76	0
Qwen3.7 Plus	10.0	10.0	100.0%	0		16.13s	699	102	5,013

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.45s	558	282	0
Qwen3.7 Plus	10.0	10.0	100.0%	0		16.38s	696	280	7,312

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.79s	5,457	234	0
Qwen3.7 Plus	10.0	10.0	100.0%	0		15.02s	8,193	292	1,831

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	3.0	10.0	0.0%	0		1.76s	156	12	0
Qwen3.7 Plus	3.0	10.0	0.0%	0		91.07s	204	26	15,041

Vergleichspaar wechseln