Navigare
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs Qwen: Qwen3.5 Plus 2026-04-20

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-27

Metrică Claude Opus 4.7 Claude Opus 4.7 none Lansare: 2026-04-16 Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 medium Lansare: 2026-04-20
Scor 9.2 8.1
Rang #4 #32
Fiabilitate N/D 9.7
Consistență 10.0 9.0
Teste corecte
Rată de trecere pe încercare 88.9% 77.8%
Teste instabile 0 2
Rulări totale 54 54
Cost per rezultat 3.155 2.065
Cost total $0.505 $0.269
Preț de intrare $5.000 / 1M $0.400 / 1M
Preț de ieșire $25.000 / 1M $2.400 / 1M
Tokenuri de ieșire 6,326 2,179
Tokenuri de raționament 0 103,832
Timp de răspuns (mediu) 3.13s 32.81s
Timp de răspuns (maxim) 18.27s 92.41s
Timp de răspuns (total) 56.33s 590.65s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.7 8.3 10.0 75.0% 0 2.12s 522 0
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 10.84s 215 7,748
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.7 10.0 10.0 100.0% 0 2.84s 494 0
Qwen3.5 Plus 2026-04-20 7.6 10.0 100.0% 0 85.72s 248 11,081
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.7 9.5 10.0 100.0% 0 18.27s 3,504 0
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 92.41s 483 17,490
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.7 10.0 10.0 100.0% 0 2.15s 324 0
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 38.32s 270 14,668
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.7 7.7 10.0 66.7% 0 1.19s 78 0
Qwen3.5 Plus 2026-04-20 2.9 7.2 11.1% 1 53.10s 63 28,414
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.7 10.0 10.0 100.0% 0 3.47s 257 0
Qwen3.5 Plus 2026-04-20 4.9 9.6 0.0% 0 25.30s 125 4,792
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.7 10.0 10.0 100.0% 0 1.46s 114 0
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 20.25s 103 7,689
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.7 10.0 10.0 100.0% 0 2.58s 661 0
Qwen3.5 Plus 2026-04-20 8.2 7.2 88.9% 1 17.58s 324 9,786
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.7 10.0 10.0 100.0% 0 4.74s 372 0
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 14.72s 348 2,164

Comparație rapidă

Schimbă perechea de comparație