AI BENCHY Compare

Elephant Alpha vs Qwen: Qwen3 Coder Next

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-06-03

Metrik	Elephant Alpha Elephant Alpha medium Veröffentlichung: 2026-04-14	Qwen3 Coder Next Qwen3 Coder Next none Veröffentlichung: 2026-02-03

Metrik	Elephant Alpha Elephant Alpha medium Veröffentlichung: 2026-04-14	Qwen3 Coder Next Qwen3 Coder Next none Veröffentlichung: 2026-02-03
Punktzahl	5.3	5.1
Rang	#134	#138
Zuverlässigkeit	k. A.	10.0
Konsistenz	9.7	9.7
Korrekte Tests
Erfolgsquote pro Versuch	31.7%	28.3%
Instabile Tests	1	1
Gesamtläufe	60	60
Kosten pro Ergebnis	0.000	0.159
Gesamtkosten	$0.000	$0.008
Eingabepreis	$0.000 / 1M	$0.110 / 1M
Ausgabepreis	$0.000 / 1M	$0.800 / 1M
Gesamte Eingabe-Token	33,744	44,864
Ausgabe-Token	2,596	3,575
Denk-Token	0	0
Antwortzeit (Durchschnitt)	1.27s	9.05s
Antwortzeit (Maximum)	3.70s	45.14s
Antwortzeit (Gesamt)	22.82s	126.72s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Elephant Alpha	6.6	10.0	50.0%	0		1.19s	726	815	0
Qwen3 Coder Next	3.6	10.0	0.0%	0		3.31s	645	1,321	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Elephant Alpha	4.0	6.7	16.7%	1		1.30s	813	365	0
Qwen3 Coder Next	5.4	6.9	33.3%	1		2.01s	4,799	612	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Elephant Alpha	3.0	10.0	0.0%	0		3.70s	14,046	562	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		45.14s	20,469	317	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Elephant Alpha	6.5	10.0	50.0%	0		979ms	8,004	246	0
Qwen3 Coder Next	6.5	10.0	50.0%	0		1.32s	7,758	246	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Elephant Alpha	3.0	10.0	0.0%	0		925ms	810	24	0
Qwen3 Coder Next	5.3	10.0	33.3%	0		962ms	753	26	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Elephant Alpha	4.3	10.0	0.0%	0		920ms	540	105	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	498	152	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Elephant Alpha	9.8	10.0	100.0%	0		987ms	732	82	0
Qwen3 Coder Next	6.3	10.0	50.0%	0		7.78s	684	63	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Elephant Alpha	5.3	10.0	33.3%	0		868ms	729	166	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		24.34s	678	571	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Elephant Alpha	3.0	10.0	0.0%	0		2.83s	7,344	231	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	8,364	255	0

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Elephant Alpha	3.0	10.0	0.0%	0		0ms	0	0	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		601ms	216	12	0

Schnellvergleich

Vergleichspaar wechseln

Kimi K2.5nonevsElephant Alphamedium Elephant AlphamediumvsGLM 5 Turbonone Ling-2.6-flashnonevsElephant Alphamedium Elephant AlphamediumvsQwen3.5-122B-A10Bnone DeepSeek V3.2nonevsElephant Alphamedium Elephant AlphamediumvsGrok 4.20none gpt-oss-120bnoneKostenlos verfügbarvsElephant Alphamedium DeepSeek V4 FlashnonevsElephant Alphamedium Elephant AlphamediumvsQwen3.6 Flashnone Nemotron 3 SupernoneKostenlos verfügbarvsElephant Alphamedium Mistral Small 4nonevsElephant Alphamedium Kimi K2.6noneKostenlos verfügbarvsElephant Alphamedium