Gemini 3.1 Flash Lite (low) vs Qwen3.5-27B

Empfohlenes Modell Qwen3.5-27B

Es hat hier die beste Punktzahl (6.5) und kostet etwa 10.7x weniger als Gemini 3.1 Flash Lite (low).

Detaillierter Vergleich

Metrik	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite low Veröffentlichung: 2026-05-08	Qwen3.5-27B Qwen3.5-27B none Veröffentlichung: 2026-02-24

Metrik	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite low Veröffentlichung: 2026-05-08	Qwen3.5-27B Qwen3.5-27B none Veröffentlichung: 2026-02-24
Punktzahl	6.5	6.5
Rang	#118	#116
Zuverlässigkeit	10.0	10.0
Konsistenz	9.2	9.3
Korrekte Tests
Erfolgsquote pro Versuch	59.1%	40.9%
Instabile Tests	2	2
Gesamtläufe	66	66
Kosten pro Ergebnis	5.170	0.763
Gesamtkosten	$0.621	$0.058
Eingabepreis	$0.250 / 1M	$0.195 / 1M
Ausgabepreis	$1.500 / 1M	$1.560 / 1M
Gesamte Eingabe-Token	94,224	102,316
Ausgabe-Token	7,759	24,321
Denk-Token	390,126	0
Antwortzeit (Durchschnitt)	16.26s	4.76s
Antwortzeit (Maximum)	318.02s	69.46s
Antwortzeit (Gesamt)	357.64s	104.71s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

low

none

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	7.3	6.2	75.0%	2		1.84s	500	1,013	1,548
Qwen3.5-27B	4.8	10.0	25.0%	0		788ms	696	267	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	5.5	10.0	33.3%	0		1.53s	8,132	471	1,072
Qwen3.5-27B	5.8	10.0	33.3%	0		1.80s	7,913	415	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	3.2	9.1	0.0%	0		161.25s	70,202	5,375	381,841
Qwen3.5-27B	6.4	5.8	66.7%	1		39.43s	74,756	22,190	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.44s	7,453	291	697
Qwen3.5-27B	10.0	10.0	100.0%	0		1.43s	7,794	243	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	5.3	10.0	33.3%	0		1.52s	639	15	1,214
Qwen3.5-27B	3.0	10.0	0.0%	0		540ms	789	15	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	4.0	10.0	0.0%	0		1.37s	492	69	438
Qwen3.5-27B	5.0	10.0	0.0%	0		2.51s	522	126	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.52s	619	72	760
Qwen3.5-27B	6.3	10.0	50.0%	0		1.03s	711	69	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.40s	570	210	1,191
Qwen3.5-27B	6.7	7.9	55.6%	1		1.38s	714	683	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		5.66s	5,457	234	945
Qwen3.5-27B	10.0	10.0	100.0%	0		3.54s	8,211	303	0

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		1.46s	160	9	420
Qwen3.5-27B	3.0	10.0	0.0%	0		599ms	210	10	0

Vergleichspaar wechseln