Qwen3.6 Flash (medium) vs Step 3.7 Flash (high)

Empfohlenes Modell Qwen3.6 Flash (medium)

Es hat hier die beste Punktzahl (6.9) und kostet etwa 1.6x weniger als Step 3.7 Flash (high).

Detaillierter Vergleich

Metrik	Qwen3.6 Flash Qwen3.6 Flash medium Veröffentlichung: 2026-04-20	Step 3.7 Flash Step 3.7 Flash high Veröffentlichung: 2026-05-29

Metrik	Qwen3.6 Flash Qwen3.6 Flash medium Veröffentlichung: 2026-04-20	Step 3.7 Flash Step 3.7 Flash high Veröffentlichung: 2026-05-29
Punktzahl	6.9	6.9
Rang	#93	#94
Zuverlässigkeit	10.0	10.0
Konsistenz	8.2	8.0
Korrekte Tests
Erfolgsquote pro Versuch	68.2%	63.6%
Instabile Tests	5	5
Gesamtläufe	66	66
Kosten pro Ergebnis	6.784	10.973
Gesamtkosten	$0.738	$1.207
Eingabepreis	$0.188 / 1M	$0.200 / 1M
Ausgabepreis	$1.125 / 1M	$1.150 / 1M
Gesamte Eingabe-Token	129,041	98,691
Ausgabe-Token	20,026	1,032,395
Denk-Token	614,312	0
Antwortzeit (Durchschnitt)	44.65s	64.68s
Antwortzeit (Maximum)	578.13s	364.99s
Antwortzeit (Gesamt)	982.32s	1423.01s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

Ungültiges SVG

high

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.6 Flash	10.0	10.0	100.0%	0		6.10s	672	624	14,024
Step 3.7 Flash	10.0	10.0	100.0%	0		13.40s	696	42,656	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.6 Flash	5.0	5.1	44.5%	2		42.85s	7,895	495	67,967
Step 3.7 Flash	4.0	6.0	22.2%	1		206.21s	6,057	327,340	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.6 Flash	6.5	10.0	50.0%	0		299.21s	101,613	17,514	382,793
Step 3.7 Flash	8.7	6.9	83.3%	1		41.23s	73,938	49,842	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.6 Flash	10.0	10.0	100.0%	0		9.65s	7,782	270	13,155
Step 3.7 Flash	10.0	10.0	100.0%	0		14.72s	7,368	23,113	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.6 Flash	3.5	4.4	33.3%	2		14.65s	771	60	24,409
Step 3.7 Flash	4.1	4.4	44.5%	2		149.64s	783	410,502	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.6 Flash	4.8	9.9	0.0%	0		9.88s	516	140	5,445
Step 3.7 Flash	5.5	10.0	0.0%	0		4.17s	510	2,862	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.6 Flash	10.0	10.0	100.0%	0		6.05s	699	102	7,423
Step 3.7 Flash	9.8	10.0	100.0%	0		1.52s	705	2,010	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.6 Flash	8.2	7.2	88.9%	1		6.29s	696	460	10,860
Step 3.7 Flash	5.3	7.2	44.4%	1		10.22s	711	25,422	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.6 Flash	10.0	10.0	100.0%	0		4.00s	8,193	335	1,188
Step 3.7 Flash	10.0	10.0	100.0%	0		2.79s	7,701	1,172	0

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Qwen3.6 Flash	3.0	10.0	0.0%	0		122.87s	204	26	87,048
Step 3.7 Flash	3.0	10.0	0.0%	0		149.34s	222	147,476	0

Vergleichspaar wechseln