Navigare
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs DeepSeek: DeepSeek V4 Pro

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-24

Metrică Claude Opus 4.6 Claude Opus 4.6 medium Lansare: 2026-02-05 DeepSeek V4 Pro DeepSeek V4 Pro high Lansare: 2026-04-24
Scor 7.6 7.4
Rang #43 #50
Consistență 9.1 10.0
Teste corecte
Rată de trecere pe încercare 70.4% 61.1%
Teste instabile 2 0
Rulări totale 54 24
Cost per rezultat 12.047 1.385
Cost total $1.446 $0.153
Preț de intrare $5.000 / 1M $1.740 / 1M
Preț de ieșire $25.000 / 1M $3.480 / 1M
Tokenuri de ieșire 29,829 584
Tokenuri de raționament 18,938 37,708
Timp de răspuns (mediu) 21.08s 78.45s
Timp de răspuns (maxim) 83.40s 351.99s
Timp de răspuns (total) 231.84s 1255.22s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
DeepSeek V4 Pro 8.3 10.0 75.0% 0 32.12s 64 1,799
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
DeepSeek V4 Pro 10.0 10.0 100.0% 0 93.00s 82 2,808
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
DeepSeek V4 Pro 10.0 10.0 100.0% 0 71.08s 134 2,163
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
DeepSeek V4 Pro 10.0 10.0 100.0% 0 63.00s 67 1,071
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
DeepSeek V4 Pro 5.3 10.0 33.3% 0 202.56s 11 25,343
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
DeepSeek V4 Pro 5.0 10.0 0.0% 0 26.96s 51 734
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
DeepSeek V4 Pro 3.0 10.0 0.0% 0 0ms 0 0
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
DeepSeek V4 Pro 7.7 10.0 66.7% 0 63.66s 91 3,617
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
DeepSeek V4 Pro 10.0 10.0 100.0% 0 11.05s 84 173

Comparație rapidă

Schimbă perechea de comparație