Gemini 3.1 Flash Lite (low) vs Qwen3.6 27B (medium)

Empfohlenes Modell Gemini 3.1 Flash Lite (low)

Die Punktzahl bleibt nah an der besten hier (6.5 vs 6.5) und es antwortet etwa 6.5x schneller als Qwen3.6 27B (medium).

Detaillierter Vergleich

Metrik	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite low Veröffentlichung: 2026-05-08	Qwen3.6 27B Qwen3.6 27B medium Veröffentlichung: 2026-04-20

Metrik	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite low Veröffentlichung: 2026-05-08	Qwen3.6 27B Qwen3.6 27B medium Veröffentlichung: 2026-04-20
Punktzahl	6.5	6.5
Rang	#115	#109
Zuverlässigkeit	10.0	10.0
Konsistenz	9.2	8.0
Korrekte Tests
Erfolgsquote pro Versuch	59.1%	59.1%
Instabile Tests	2	6
Gesamtläufe	66	66
Kosten pro Ergebnis	5.170	7.319
Gesamtkosten	$0.621	$0.680
Eingabepreis	$0.250 / 1M	$0.290 / 1M
Ausgabepreis	$1.500 / 1M	$2.400 / 1M
Gesamte Eingabe-Token	94,224	106,167
Ausgabe-Token	7,759	32,889
Denk-Token	390,126	241,303
Antwortzeit (Durchschnitt)	16.26s	106.32s
Antwortzeit (Maximum)	318.02s	1085.11s
Antwortzeit (Gesamt)	357.64s	2339.12s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

low

medium

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	7.3	6.2	75.0%	2		1.84s	500	1,013	1,548
Qwen3.6 27B	8.3	10.0	75.0%	0		12.62s	453	582	4,311

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	5.5	10.0	33.3%	0		1.53s	8,132	471	1,072
Qwen3.6 27B	7.7	10.0	66.7%	0		142.99s	5,051	7,968	43,367

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	3.2	9.1	0.0%	0		161.25s	70,202	5,375	381,841
Qwen3.6 27B	6.7	3.7	50.0%	2		584.09s	81,895	18,788	133,471

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.44s	7,453	291	697
Qwen3.6 27B	3.5	1.4	50.0%	2		37.30s	7,778	568	9,404

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	5.3	10.0	33.3%	0		1.52s	639	15	1,214
Qwen3.6 27B	2.9	7.2	11.1%	1		73.38s	662	3,510	20,352

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	4.0	10.0	0.0%	0		1.37s	492	69	438
Qwen3.6 27B	6.5	3.4	66.7%	1		39.53s	516	81	3,045

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.52s	619	72	760
Qwen3.6 27B	10.0	10.0	100.0%	0		37.96s	699	346	6,548

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.40s	570	210	1,191
Qwen3.6 27B	7.7	10.0	66.7%	0		61.14s	696	255	12,044

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		5.66s	5,457	234	945
Qwen3.6 27B	10.0	10.0	100.0%	0		16.88s	8,213	390	2,954

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		1.46s	160	9	420
Qwen3.6 27B	3.0	10.0	0.0%	0		80.99s	204	401	5,807

Vergleichspaar wechseln