Gemini 3.1 Flash Lite (medium) vs Step 3.7 Flash (low)

Empfohlenes Modell Gemini 3.1 Flash Lite (medium)

Es hat hier die beste Punktzahl (7.3) und kostet etwa 3.9x weniger als Step 3.7 Flash (low).

Detaillierter Vergleich

Metrik	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Veröffentlichung: 2026-05-08	Step 3.7 Flash Step 3.7 Flash low Veröffentlichung: 2026-05-29

Metrik	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Veröffentlichung: 2026-05-08	Step 3.7 Flash Step 3.7 Flash low Veröffentlichung: 2026-05-29
Punktzahl	7.3	7.3
Rang	#73	#75
Zuverlässigkeit	10.0	10.0
Konsistenz	9.2	8.1
Korrekte Tests
Erfolgsquote pro Versuch	62.1%	68.2%
Instabile Tests	2	5
Gesamtläufe	66	66
Kosten pro Ergebnis	0.898	3.782
Gesamtkosten	$0.117	$0.454
Eingabepreis	$0.250 / 1M	$0.200 / 1M
Ausgabepreis	$1.500 / 1M	$1.150 / 1M
Gesamte Eingabe-Token	104,918	103,833
Ausgabe-Token	9,168	376,581
Denk-Token	51,130	0
Antwortzeit (Durchschnitt)	4.27s	20.68s
Antwortzeit (Maximum)	26.22s	124.75s
Antwortzeit (Gesamt)	94.02s	455.01s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

low

Ungültiges SVG

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	9.1	10.0	75.0%	0		2.39s	502	604	4,201
Step 3.7 Flash	8.7	7.9	91.7%	1		4.02s	756	10,896	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	5.5	10.0	33.3%	0		3.81s	8,134	459	8,978
Step 3.7 Flash	8.2	7.2	88.9%	1		9.46s	7,437	18,685	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	7.2	9.1	50.0%	0		18.55s	80,983	7,241	20,231
Step 3.7 Flash	7.3	5.8	83.3%	1		66.18s	77,415	93,682	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.60s	7,362	279	2,845
Step 3.7 Flash	7.3	5.8	83.3%	1		2.29s	7,398	2,667	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		3.16s	643	15	5,165
Step 3.7 Flash	5.3	7.2	44.4%	1		43.31s	828	104,487	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.60s	488	84	1,142
Step 3.7 Flash	3.4	9.3	0.0%	0		7.00s	525	4,604	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	9.9	10.0	100.0%	0		2.59s	623	75	3,320
Step 3.7 Flash	9.8	10.0	100.0%	0		1.58s	735	1,857	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	7.6	7.2	77.8%	1		1.95s	568	165	2,450
Step 3.7 Flash	5.5	9.9	33.3%	0		1.84s	756	3,564	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		4.55s	5,457	234	921
Step 3.7 Flash	10.0	10.0	100.0%	0		3.25s	7,746	1,360	0

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		3.08s	158	12	1,877
Step 3.7 Flash	3.0	10.0	0.0%	0		124.75s	237	134,779	0

Vergleichspaar wechseln