AI BENCHY Compare

inclusionAI: Ling-2.6-flash vs Tencent: Hy3 preview

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-05-22

Metrik	Ling-2.6-flash Ling-2.6-flash none Veröffentlichung: 2026-04-21	Hy3 preview Hy3 preview high Veröffentlichung: 2026-04-22

Metrik	Ling-2.6-flash Ling-2.6-flash none Veröffentlichung: 2026-04-21	Hy3 preview Hy3 preview high Veröffentlichung: 2026-04-22
Punktzahl	5.3	8.0
Rang	#128	#22
Zuverlässigkeit	10.0	10.0
Konsistenz	9.2	9.5
Korrekte Tests
Erfolgsquote pro Versuch	35.1%	77.1%
Instabile Tests	2	1
Gesamtläufe	60	60
Kosten pro Ergebnis	0.005	0.000
Gesamtkosten	$0.001	$0.000
Eingabepreis	$0.010 / 1M	$0.066 / 1M
Ausgabepreis	$0.030 / 1M	$0.260 / 1M
Ausgabe-Token	2,878	216,503
Denk-Token	0	0
Antwortzeit (Durchschnitt)	9.76s	56.77s
Antwortzeit (Maximum)	35.34s	149.94s
Antwortzeit (Gesamt)	185.37s	851.49s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Ling-2.6-flash	6.8	8.1	58.3%	1		11.81s	573	0
Hy3 preview	8.9	10.0	100.0%	0		15.12s	6,839	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Ling-2.6-flash	10.0	10.0	100.0%	0		11.21s	381	0
Hy3 preview	10.0	10.0	100.0%	0		99.76s	38,167	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Ling-2.6-flash	3.0	10.0	0.0%	0		35.34s	1,069	0
Hy3 preview	10.0	10.0	100.0%	0		113.09s	31,319	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Ling-2.6-flash	6.5	10.0	50.0%	0		8.48s	246	0
Hy3 preview	6.5	10.0	50.0%	0		12.11s	4,323	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Ling-2.6-flash	3.0	10.0	0.0%	0		4.95s	24	0
Hy3 preview	5.3	7.2	44.4%	1		109.04s	87,559	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Ling-2.6-flash	4.0	10.0	0.0%	0		1.45s	109	0
Hy3 preview	0.0	0.0	0.0%	0		0ms	0	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Ling-2.6-flash	9.8	10.0	100.0%	0		5.52s	81	0
Hy3 preview	9.9	10.0	100.0%	0		34.02s	13,331	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Ling-2.6-flash	2.9	7.2	11.1%	1		9.14s	151	0
Hy3 preview	10.0	10.0	100.0%	0		29.74s	15,503	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Ling-2.6-flash	3.0	10.0	0.0%	0		18.80s	229	0
Hy3 preview	10.0	10.0	100.0%	0		78.83s	10,370	0

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Ling-2.6-flash	3.0	10.0	0.0%	0		1.06s	15	0
Hy3 preview	3.0	10.0	0.0%	0		47.71s	9,092	0

Schnellvergleich

Vergleichspaar wechseln

Ling-2.6-flashnonevsElephant Alphamedium Ling-2.6-flashnonevsMistral Small 4medium Ling-2.6-flashnonevsMiniMax M2.5mediumKostenlos verfügbar Ling-2.6-flashnonevsMiniMax M2.7medium Ling-2.6-flashnonevsgpt-oss-120bmediumKostenlos verfügbar CobuddymediumKostenlos verfügbarvsLing-2.6-flashnone Ling-2.6-flashnonevsQwen3 Coder Nextmedium Ling-2.6-flashnonevsOwl Alphamedium Ling-2.6-flashnonevsNemotron 3 SupermediumKostenlos verfügbar Ling-2.6-flashnonevsGPT-5 Nanomedium Ling-2.6-flashnonevsGLM 4.7 Flashmedium Mercury 2mediumvsLing-2.6-flashnone