Navigare
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs DeepSeek: DeepSeek V4 Pro

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-24

Metrică Claude Opus 4.7 Claude Opus 4.7 medium Lansare: 2026-04-16 DeepSeek V4 Pro DeepSeek V4 Pro high Lansare: 2026-04-24
Scor 9.2 8.2
Rang #3 #20
Fiabilitate N/D N/D
Consistență 10.0 9.6
Teste corecte
Rată de trecere pe încercare 88.9% 74.1%
Teste instabile 0 1
Rulări totale 54 24
Cost per rezultat 2.790 1.224
Cost total $0.447 $0.160
Preț de intrare $5.000 / 1M $1.740 / 1M
Preț de ieșire $25.000 / 1M $3.480 / 1M
Tokenuri de ieșire 5,375 671
Tokenuri de raționament 1,341 39,383
Timp de răspuns (mediu) 3.53s 71.21s
Timp de răspuns (maxim) 21.45s 351.99s
Timp de răspuns (total) 60.03s 1281.73s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 348 0
DeepSeek V4 Pro 8.3 10.0 75.0% 0 26.93s 70 2,008
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.7 10.0 10.0 100.0% 0 6.41s 1,141 257
DeepSeek V4 Pro 10.0 10.0 100.0% 0 93.00s 82 2,808
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 2,369 1,084
DeepSeek V4 Pro 10.0 10.0 100.0% 0 71.08s 134 2,163
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 324 0
DeepSeek V4 Pro 10.0 10.0 100.0% 0 63.00s 67 1,071
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 51 0
DeepSeek V4 Pro 5.3 10.0 33.3% 0 202.56s 11 25,343
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 256 0
DeepSeek V4 Pro 5.0 10.0 0.0% 0 26.96s 51 734
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 114 0
DeepSeek V4 Pro 10.0 10.0 100.0% 0 14.60s 21 1,236
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.7 10.0 10.0 100.0% 0 2.51s 399 0
DeepSeek V4 Pro 7.6 7.4 77.8% 1 69.69s 151 3,847
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 373 0
DeepSeek V4 Pro 10.0 10.0 100.0% 0 11.05s 84 173

Comparație rapidă

Schimbă perechea de comparație