नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.5 vs Qwen: Qwen3.6 Max Preview

सारांश

GPT-5.5 vs Qwen3.6 Max Preview benchmark तुलना: GPT-5.5 average score मध्ये पुढे आहे: 9.0 vs 6.0. Qwen3.6 Max Preview चा benchmark खर्च कमी आहे: $0.075 vs $3.679. Qwen3.6 Max Preview वेगवान आहे: 3.30s vs 37.98s, pass rates 87.3% vs 58.7%.

शिफारस केलेले मॉडेल: Qwen3.6 Max Preview - It offers the best overall trade-off: a competitive score (6.0), lower cost than GPT-5.5, and balanced response time.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक GPT-5.5 GPT-5.5 medium प्रकाशन: 2026-04-24 Qwen3.6 Max Preview Qwen3.6 Max Preview none प्रकाशन: 2026-04-20
स्कोअर 9.0 6.0
क्रमांक #9 #100
विश्वसनीयता 10.0 10.0
सुसंगतता 8.9 9.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 87.3% 58.7%
अस्थिर चाचण्या 3 2
एकूण रन 63 63
प्रति निकाल खर्च 21.638 0.824
एकूण खर्च $3.679 $0.075
इनपुट किंमत $5.000 / 1M $1.040 / 1M
आउटपुट किंमत $30.000 / 1M $6.240 / 1M
एकूण इनपुट टोकन्स 34,212 42,509
आउटपुट टोकन्स 1,985 4,779
रिझनिंग टोकन्स 114,925 0
प्रतिसाद वेळ (सरासरी) 37.98s 3.30s
प्रतिसाद वेळ (कमाल) 332.10s 20.51s
प्रतिसाद वेळ (एकूण) 797.60s 69.40s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#9 GPT-5.5

medium
खर्च
$0.112
वेळ
71.9s
टोकन्स
3,807 tok

#100 Qwen3.6 Max Preview

none
खर्च
$0.025
वेळ
83.9s
टोकन्स
4,066 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.66s 606 250 1,335
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 696 513 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 8.8 7.8 88.9% 1 59.77s 7,305 362 24,959
Qwen3.6 Max Preview 3.8 7.3 22.2% 1 3.12s 7,913 456 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 19.29s 11,019 312 2,841
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 14,949 2,842 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.18s 7,140 234 593
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 7,794 243 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 5.3 7.2 44.4% 1 164.14s 723 67 79,625
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 789 18 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.16s 477 138 223
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 522 76 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 3.36s 660 93 538
Qwen3.6 Max Preview 9.8 10.0 100.0% 0 1.40s 711 69 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 6.76s 642 241 2,225
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.65s 714 321 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 10.57s 5,445 258 832
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 8,211 222 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 2.8 1.6 33.3% 1 37.86s 195 30 1,754
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 1.97s 210 19 0

झटपट तुलना

तुलना जोडी बदला