नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.5 vs Qwen: Qwen3.6 Max Preview

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-27

मेट्रिक GPT-5.5 GPT-5.5 medium प्रकाशन: 2026-04-24 Qwen3.6 Max Preview Qwen3.6 Max Preview medium प्रकाशन: 2026-04-20
स्कोअर 9.0 8.8
क्रमांक #6 #8
विश्वसनीयता लागू नाही 10.0
सुसंगतता 9.2 9.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 87.0% 85.2%
अस्थिर चाचण्या 2 1
एकूण रन 54 54
प्रति निकाल खर्च 19.226 5.486
एकूण खर्च $2.884 $0.823
???? ??? $5.000 / 1M $1.300 / 1M
????? ??? $30.000 / 1M $7.800 / 1M
आउटपुट टोकन्स 1,920 2,158
रिझनिंग टोकन्स 89,632 97,495
प्रतिसाद वेळ (सरासरी) 32.75s 48.31s
प्रतिसाद वेळ (कमाल) 332.10s 186.74s
प्रतिसाद वेळ (एकूण) 589.59s 869.64s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.66s 250 1,335
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 22.13s 228 10,075
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 9.09s 318 1,391
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 117.87s 368 13,790
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 19.29s 312 2,841
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 121.49s 390 14,575
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.18s 234 593
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 41.15s 270 10,106
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 5.3 7.2 44.4% 1 164.14s 67 79,625
Qwen3.6 Max Preview 2.9 7.2 11.1% 1 95.91s 60 30,371
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.16s 138 223
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 32.24s 129 3,510
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 3.36s 93 538
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 24.31s 103 5,848
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 8.6 7.9 77.8% 1 6.78s 250 2,254
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 24.19s 301 7,649
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 10.57s 258 832
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 18.32s 309 1,571

झटपट तुलना

तुलना जोडी बदला