नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Qwen: Qwen3.6 Max Preview

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 medium प्रकाशन: 2026-05-28 Qwen3.6 Max Preview Qwen3.6 Max Preview medium प्रकाशन: 2026-04-20
स्कोअर 8.7 8.4
क्रमांक #12 #16
विश्वसनीयता 10.0 10.0
सुसंगतता 9.6 9.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 83.3% 80.0%
अस्थिर चाचण्या 1 2
एकूण रन 60 60
प्रति निकाल खर्च 6.285 6.910
एकूण खर्च $1.006 $0.872
इनपुट किंमत $5.000 / 1M $1.040 / 1M
आउटपुट किंमत $25.000 / 1M $6.240 / 1M
आउटपुट टोकन्स 23,201 2,253
रिझनिंग टोकन्स 5,901 130,852
प्रतिसाद वेळ (सरासरी) 9.34s 58.43s
प्रतिसाद वेळ (कमाल) 38.03s 238.07s
प्रतिसाद वेळ (एकूण) 186.84s 1168.66s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 1,179 478
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 22.13s 228 10,075
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 14.97s 6,651 1,381
Qwen3.6 Max Preview 8.2 6.7 83.3% 1 177.97s 407 39,442
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 5,260 1,588
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 121.49s 390 14,575
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 481 312
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 41.15s 270 10,106
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 7,477 900
Qwen3.6 Max Preview 2.9 7.2 11.1% 1 95.91s 60 30,371
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 237 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 32.24s 129 3,510
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 373 320
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 24.31s 103 5,848
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 791 483
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 24.32s 329 7,693
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 301 225
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 18.32s 309 1,571
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 451 214
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 60.56s 28 7,661

झटपट तुलना

तुलना जोडी बदला