#78
Qwen
Veröffentlichung: 2026-04-20
Getestet am: 2026-04-27 21:31
qwen/qwen3.6-27b::none
(medium)
(none)
Eingabepreis
$0.500 / 1M
Ausgabepreis
$2.000 / 1M
Instabile Tests
4
Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).
Testverlauf
| Getestet am | Punktzahl | Zuverlässigkeit | Korrekte Tests | Gesamtkosten | Vergleichen |
|---|---|---|---|---|---|
| 2026-04-27 21:46 Neuer Test hinzugefügt | 6.0 | 10.0 | $0.031 | Vergleichen | |
| 2026-04-27 21:31 Erster erfasster Lauf | 5.9 | 10.0 | $0.027 | Aktueller Lauf |
Laufvergleich
| Lauf | Punktzahl | Konsistenz | Zuverlässigkeit | Korrekte Tests | Instabile Tests | Gesamte Ausgabe-Token | Gesamtkosten | Antwortzeit (Durchschnitt) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-27 21:31 · Erster erfasster Lauf | 5.9 | 6.9 | 10.0 | 4/11 | 4 | 2,924 | $0.027 | 4.19s |
| 2026-04-27 21:46 · Neuer Test hinzugefügt | 6.0 | 7.2 | 10.0 | 7/18 | 6 | 3,775 | $0.031 | 4.00s |
| Differenz | -0.1 | -0.3 | 0.0 | -3 | -2 | -851 | -$0.004 | +186ms |
Diese beiden Läufe nutzten unterschiedliche Benchmark-Suiten, daher spiegeln die Deltas sowohl Modell- als auch Suite-Änderungen wider.
Diagramme
Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.
Punktzahl vs Gesamtkosten
Antwortzeit (Durchschnitt)
Punktzahl vs Antwortzeit (Durchschnitt)
Gesamte Ausgabe-Token
Punktzahl vs Gesamte Ausgabe-Token
Schnellvergleich
Qwen3.6 27BnonevsQwen3.5-FlashnoneQwen3.6 27BnonevsSeed-2.0-LitenoneQwen3.6 27BnonevsGLM 5V TurbononeQwen3.6 27BnonevsGemini 2.5 FlashnoneQwen3.6 27BnonevsGPT-5 NanomediumQwen3.6 27BnonevsQwen3.5-35B-A3BnoneQwen3.6 27BnonevsGemini 3 Flash PreviewmediumQwen3.6 27BnonevsGemini 3.1 Pro PreviewmediumQwen3.6 27BnonevsHY3 PreviewhighKostenlos verfügbar
Kategorieaufschlüsselung
| Kategorie | Punktzahl | Konsistenz | Korrekte Tests |
|---|---|---|---|
| Anti-KI-Tricks | 4.0 | 1.6 | |
| Programmierung | 10.0 | 10.0 | |
| Kombiniert | 3.0 | 10.0 | |
| Datenanalyse und -extraktion | 9.9 | 10.0 | |
| Domänenspezifisch | 6.5 | 10.0 | |
| Allgemeine Intelligenz | 5.2 | 9.9 | |
| Befolgung von Anweisungen | 2.8 | 1.6 | |
| Werkzeugaufrufe | 9.5 | 10.0 |