Navigatie
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs Qwen: Qwen3.6 35B A3B

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-10

Metriek Claude Opus 4.7 Claude Opus 4.7 medium Releasedatum: 2026-04-16 Qwen3.6 35B A3B Qwen3.6 35B A3B medium Releasedatum: 2026-04-20
Score 8.9 8.0
Rang #3 #21
Betrouwbaarheid 10.0 9.8
Consistentie 10.0 9.1
Correcte tests
Slaagpercentage per poging 84.2% 74.5%
Instabiele tests 0 2
Totaal runs 57 57
Kosten per resultaat 2.802 0.959
Totale kosten $0.449 $0.116
Invoerprijs $5.000 / 1M $0.150 / 1M
Uitvoerprijs $25.000 / 1M $1.000 / 1M
Uitvoer-tokens 5,399 15,018
Redeneer-tokens 1,341 108,331
Responstijd (gem.) 3.46s 13.22s
Responstijd (max) 21.45s 45.02s
Responstijd (totaal) 62.29s 224.66s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 348 0
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 6.02s 1,154 12,385
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.7 10.0 10.0 100.0% 0 6.41s 1,141 257
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 32.58s 3,294 15,116
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 2,369 1,084
Qwen3.6 35B A3B 0.0 0.0 0.0% 0 0ms 0 0
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 324 0
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 12.99s 2,591 9,968
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 51 0
Qwen3.6 35B A3B 5.3 7.2 44.4% 1 22.50s 6,193 39,116
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 256 0
Qwen3.6 35B A3B 4.4 9.9 0.0% 0 8.66s 129 4,569
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 114 0
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 7.50s 219 7,404
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.7 10.0 10.0 100.0% 0 2.51s 399 0
Qwen3.6 35B A3B 7.9 7.5 77.8% 1 5.98s 676 9,447
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 373 0
Qwen3.6 35B A3B 0.0 0.0 0.0% 0 0ms 0 0
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Claude Opus 4.7 3.0 10.0 0.0% 0 2.25s 24 0
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 32.90s 762 10,326

Snelle vergelijking

Vergelijkingspaar wisselen