AI BENCHY Compare

Google: Gemini 3.5 Flash vs Nemotron 3 Ultra 550b A55b

Zusammenfassung

Gemini 3.5 Flash vs Nemotron 3 Ultra 550b A55b Benchmark-Vergleich: Gemini 3.5 Flash führt beim Durchschnittsscore mit 9.1 vs 8.1. Nemotron 3 Ultra 550b A55b hat die niedrigeren Benchmark-Kosten mit $0.158 vs $0.582. Gemini 3.5 Flash ist schneller mit 4.94s vs 15.05s, mit Erfolgsraten von 87.3% vs 69.8%.

Empfohlenes Modell: Gemini 3.5 Flash - Es hat hier die beste Punktzahl (9.1) und antwortet etwa 3.0x schneller als Nemotron 3 Ultra 550b A55b.

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-06-18

Metrik	Gemini 3.5 Flash Gemini 3.5 Flash medium Veröffentlichung: 2026-05-19	Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b medium Veröffentlichung: 2026-06-04 Kostenlos verfügbar

Metrik	Gemini 3.5 Flash Gemini 3.5 Flash medium Veröffentlichung: 2026-05-19	Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b medium Veröffentlichung: 2026-06-04 Kostenlos verfügbar
Punktzahl	9.1	8.1
Rang	#8	#26
Zuverlässigkeit	10.0	9.7
Konsistenz	9.6	8.8
Korrekte Tests
Erfolgsquote pro Versuch	87.3%	69.8%
Instabile Tests	1	3
Gesamtläufe	63	63
Kosten pro Ergebnis	3.229	0.000
Gesamtkosten	$0.582	$0.158
Eingabepreis	$1.500 / 1M	$0.500 / 1M
Ausgabepreis	$9.000 / 1M	$2.200 / 1M
Gesamte Eingabe-Token	36,936	46,813
Ausgabe-Token	2,001	18,002
Denk-Token	56,408	53,091
Antwortzeit (Durchschnitt)	4.94s	15.05s
Antwortzeit (Maximum)	18.07s	43.93s
Antwortzeit (Gesamt)	103.79s	316.09s

Generierungs-Showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#8 Gemini 3.5 Flash

medium

Kosten: $0.201
Zeit: 112.9s
Token: 22,371 tok

#26 Nemotron 3 Ultra 550b A55b

medium

Ungültiges SVG

Kosten: $0.000
Zeit: 300.0s
Token: 0 tok

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.09s	492	171	3,385
Nemotron 3 Ultra 550b A55b	10.0	10.0	100.0%	0		8.62s	780	835	1,485

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	7.9	7.5	77.8%	1		12.63s	8,118	461	24,939
Nemotron 3 Ultra 550b A55b	8.4	7.4	88.9%	1		26.53s	7,686	2,854	17,725

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	10.0	10.0	100.0%	0		12.05s	12,873	351	7,807
Nemotron 3 Ultra 550b A55b	9.8	10.0	100.0%	0		43.93s	17,574	1,040	3,590

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	10.0	10.0	100.0%	0		4.07s	7,548	279	3,784
Nemotron 3 Ultra 550b A55b	10.0	10.0	100.0%	0		5.68s	7,989	473	1,285

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	7.7	10.0	66.7%	0		5.24s	633	12	8,047
Nemotron 3 Ultra 550b A55b	3.5	4.4	33.3%	2		24.90s	858	11,169	16,249

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.52s	486	115	1,144
Nemotron 3 Ultra 550b A55b	3.7	9.5	0.0%	0		2.52s	360	70	235

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	9.9	10.0	100.0%	0		2.70s	615	71	2,855
Nemotron 3 Ultra 550b A55b	9.8	10.0	100.0%	0		6.35s	765	182	1,243

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	7.7	10.0	66.7%	0		2.38s	558	295	2,747
Nemotron 3 Ultra 550b A55b	5.5	9.9	33.3%	0		3.54s	792	771	2,055

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.81s	5,457	234	455
Nemotron 3 Ultra 550b A55b	10.0	10.0	100.0%	0		7.72s	9,781	304	984

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.75s	156	12	1,245
Nemotron 3 Ultra 550b A55b	3.0	10.0	0.0%	0		38.47s	228	304	8,240

Schnellvergleich

Vergleichspaar wechseln