Gemma 4 31B (medium) vs Nemotron 3 Ultra

Empfohlenes Modell Nemotron 3 Ultra

Die Punktzahl bleibt nah an der besten hier (6.1 vs 6.3) und es antwortet etwa 19.5x schneller als Gemma 4 31B (medium).

Detaillierter Vergleich

Metrik	Gemma 4 31B Gemma 4 31B medium Veröffentlichung: 2026-04-02 Kostenlos verfügbar	Nemotron 3 Ultra Nemotron 3 Ultra none Veröffentlichung: 2026-06-04 Kostenlos verfügbar

Metrik	Gemma 4 31B Gemma 4 31B medium Veröffentlichung: 2026-04-02 Kostenlos verfügbar	Nemotron 3 Ultra Nemotron 3 Ultra none Veröffentlichung: 2026-06-04 Kostenlos verfügbar
Punktzahl	6.3	6.1
Rang	#124	#144
Zuverlässigkeit	10.0	10.0
Konsistenz	9.0	9.3
Korrekte Tests
Erfolgsquote pro Versuch	68.2%	42.4%
Instabile Tests	2	2
Gesamtläufe	66	66
Kosten pro Ergebnis	1.044	0.000
Gesamtkosten	$0.116	$0.095
Eingabepreis	$0.140 / 1M	$0.600 / 1M
Ausgabepreis	$0.400 / 1M	$3.600 / 1M
Gesamte Eingabe-Token	94,992	101,275
Ausgabe-Token	34,468	9,474
Denk-Token	223,278	0
Antwortzeit (Durchschnitt)	75.38s	3.87s
Antwortzeit (Maximum)	437.40s	37.50s
Antwortzeit (Gesamt)	1507.52s	85.15s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

none

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemma 4 31B	10.0	10.0	100.0%	0		12.89s	816	962	2,046
Nemotron 3 Ultra	3.5	8.0	16.7%	1		2.35s	696	239	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemma 4 31B	4.3	5.8	22.2%	1		219.76s	5,568	11,098	33,212
Nemotron 3 Ultra	5.5	10.0	33.3%	0		1.02s	7,623	369	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemma 4 31B	2.9	5.8	16.7%	1		433.11s	77,035	12,112	157,552
Nemotron 3 Ultra	3.0	10.0	0.0%	0		21.14s	73,507	7,693	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemma 4 31B	10.0	10.0	100.0%	0		21.11s	8,334	1,822	2,951
Nemotron 3 Ultra	10.0	10.0	100.0%	0		1.94s	7,944	249	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemma 4 31B	7.7	10.0	66.7%	0		38.48s	876	4,349	8,985
Nemotron 3 Ultra	5.3	10.0	33.3%	0		698ms	789	27	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemma 4 31B	10.0	10.0	100.0%	0		9.57s	567	105	888
Nemotron 3 Ultra	5.0	10.0	0.0%	0		13.49s	516	101	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemma 4 31B	10.0	10.0	100.0%	0		12.76s	777	533	2,035
Nemotron 3 Ultra	10.0	10.0	100.0%	0		1.46s	723	69	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemma 4 31B	9.9	10.0	100.0%	0		26.91s	801	1,795	5,595
Nemotron 3 Ultra	5.9	7.2	55.6%	1		1.06s	726	352	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemma 4 31B	3.0	10.0	0.0%	0		0ms	0	0	0
Nemotron 3 Ultra	10.0	10.0	100.0%	0		2.99s	8,544	264	0

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemma 4 31B	3.0	10.0	0.0%	0		90.14s	218	1,692	10,014
Nemotron 3 Ultra	3.0	10.0	0.0%	0		1.83s	207	111	0

Vergleichspaar wechseln