AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Qwen: Qwen3 Coder Next

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-04-29

Metrik	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Veröffentlichung: 2026-02-19	Qwen3 Coder Next Qwen3 Coder Next none Veröffentlichung: 2026-02-03

Metrik	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Veröffentlichung: 2026-02-19	Qwen3 Coder Next Qwen3 Coder Next none Veröffentlichung: 2026-02-03
Punktzahl	9.6	5.1
Rang	#2	#113
Zuverlässigkeit	k. A.	k. A.
Konsistenz	10.0	9.7
Korrekte Tests
Erfolgsquote pro Versuch	94.4%	25.9%
Instabile Tests	0	1
Gesamtläufe	54	54
Kosten pro Ergebnis	3.400	0.188
Gesamtkosten	$0.578	$0.008
Eingabepreis	$2.000 / 1M	$0.140 / 1M
Ausgabepreis	$12.000 / 1M	$0.800 / 1M
Ausgabe-Token	1,932	3,617
Denk-Token	40,542	0
Antwortzeit (Durchschnitt)	15.96s	10.18s
Antwortzeit (Maximum)	40.61s	45.14s
Antwortzeit (Gesamt)	175.52s	122.13s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	112	3,218
Qwen3 Coder Next	3.6	10.0	0.0%	0		3.31s	1,321	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		19.88s	405	4,201
Qwen3 Coder Next	7.3	3.7	66.7%	1		3.14s	585	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	432	9,281
Qwen3 Coder Next	3.0	10.0	0.0%	0		45.14s	317	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	279	3,904
Qwen3 Coder Next	6.5	10.0	50.0%	0		1.32s	246	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	18	12,424
Qwen3 Coder Next	5.3	10.0	33.3%	0		962ms	26	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179
Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	152	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236
Qwen3 Coder Next	4.8	10.0	0.0%	0		7.71s	63	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117
Qwen3 Coder Next	3.2	10.0	0.0%	0		22.86s	652	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	255	0

Schnellvergleich

Vergleichspaar wechseln

Nemotron 3 Nano Omni 30b A3b ReasoningmediumKostenlos verfügbarvsQwen3 Coder Nextnone Elephant AlphamediumvsQwen3 Coder Nextnone MiniMax M2.7mediumvsQwen3 Coder Nextnone Claude Opus 4.7nonevsGemini 3.1 Pro Previewmedium Qwen3 Coder NextnonevsGLM 4.7 Flashmedium Mistral Small 4mediumvsQwen3 Coder Nextnone Gemini 3.1 Pro PreviewmediumvsGPT-5.5low MiniMax M2.5mediumKostenlos verfügbarvsQwen3 Coder Nextnone gpt-oss-120bmediumKostenlos verfügbarvsQwen3 Coder Nextnone Laguna Xs.2mediumKostenlos verfügbarvsQwen3 Coder Nextnone Gemini 3.1 Pro PreviewmediumvsHY3 PreviewhighKostenlos verfügbar GPT-5 NanomediumvsQwen3 Coder Nextnone