Gemini 3.5 Flash (minimal) vs Qwen3.6 27B (medium)

Empfohlenes Modell Gemini 3.5 Flash (minimal)

Es hat hier die beste Punktzahl (6.8) und kostet etwa 2.3x weniger als Qwen3.6 27B (medium).

Detaillierter Vergleich

Metrik	Gemini 3.5 Flash Gemini 3.5 Flash minimal Veröffentlichung: 2026-05-19	Qwen3.6 27B Qwen3.6 27B medium Veröffentlichung: 2026-04-20

Metrik	Gemini 3.5 Flash Gemini 3.5 Flash minimal Veröffentlichung: 2026-05-19	Qwen3.6 27B Qwen3.6 27B medium Veröffentlichung: 2026-04-20
Punktzahl	6.8	6.5
Rang	#96	#109
Zuverlässigkeit	10.0	10.0
Konsistenz	9.6	8.0
Korrekte Tests
Erfolgsquote pro Versuch	65.2%	59.1%
Instabile Tests	1	6
Gesamtläufe	66	66
Kosten pro Ergebnis	2.138	7.319
Gesamtkosten	$0.300	$0.680
Eingabepreis	$1.500 / 1M	$0.290 / 1M
Ausgabepreis	$9.000 / 1M	$2.400 / 1M
Gesamte Eingabe-Token	100,753	106,167
Ausgabe-Token	16,454	32,889
Denk-Token	0	241,303
Antwortzeit (Durchschnitt)	2.65s	106.32s
Antwortzeit (Maximum)	25.26s	1085.11s
Antwortzeit (Gesamt)	58.27s	2339.12s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

minimal

medium

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	6.5	10.0	50.0%	0		892ms	492	405	0
Qwen3.6 27B	8.3	10.0	75.0%	0		12.62s	453	582	4,311

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	5.6	9.9	33.3%	0		2.75s	8,122	3,456	0
Qwen3.6 27B	7.7	10.0	66.7%	0		142.99s	5,051	7,968	43,367

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	3.0	10.0	0.0%	0		14.41s	76,686	11,581	0
Qwen3.6 27B	6.7	3.7	50.0%	2		584.09s	81,895	18,788	133,471

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.66s	7,548	279	0
Qwen3.6 27B	3.5	1.4	50.0%	2		37.30s	7,778	568	9,404

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	10.0	10.0	100.0%	0		899ms	633	12	0
Qwen3.6 27B	2.9	7.2	11.1%	1		73.38s	662	3,510	20,352

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	10.0	10.0	100.0%	0		922ms	486	117	0
Qwen3.6 27B	6.5	3.4	66.7%	1		39.53s	516	81	3,045

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	6.4	5.8	66.7%	1		893ms	615	76	0
Qwen3.6 27B	10.0	10.0	100.0%	0		37.96s	699	346	6,548

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.45s	558	282	0
Qwen3.6 27B	7.7	10.0	66.7%	0		61.14s	696	255	12,044

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.79s	5,457	234	0
Qwen3.6 27B	10.0	10.0	100.0%	0		16.88s	8,213	390	2,954

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	3.0	10.0	0.0%	0		1.76s	156	12	0
Qwen3.6 27B	3.0	10.0	0.0%	0		80.99s	204	401	5,807

Vergleichspaar wechseln