नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.5 vs Qwen: Qwen3.7 Plus

सारांश

GPT-5.5 vs Qwen3.7 Plus benchmark तुलना: GPT-5.5 average score मध्ये पुढे आहे: 9.0 vs 7.2. Qwen3.7 Plus चा benchmark खर्च कमी आहे: $0.023 vs $3.679. Qwen3.7 Plus वेगवान आहे: 2.85s vs 37.98s, pass rates 87.3% vs 47.6%.

शिफारस केलेले मॉडेल: Qwen3.7 Plus - It offers the best overall trade-off: a competitive score (7.2), lower cost than GPT-5.5, and balanced response time.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक GPT-5.5 GPT-5.5 medium प्रकाशन: 2026-04-24 Qwen3.7 Plus Qwen3.7 Plus none प्रकाशन: 2026-06-03
स्कोअर 9.0 7.2
क्रमांक #9 #60
विश्वसनीयता 10.0 10.0
सुसंगतता 8.9 10.0
बरोबर चाचण्या
प्रति प्रयत्न पास दर 87.3% 47.6%
अस्थिर चाचण्या 3 0
एकूण रन 63 63
प्रति निकाल खर्च 21.638 0.276
एकूण खर्च $3.679 $0.023
इनपुट किंमत $5.000 / 1M $0.320 / 1M
आउटपुट किंमत $30.000 / 1M $1.280 / 1M
एकूण इनपुट टोकन्स 34,212 42,510
आउटपुट टोकन्स 1,985 6,578
रिझनिंग टोकन्स 114,925 0
प्रतिसाद वेळ (सरासरी) 37.98s 2.85s
प्रतिसाद वेळ (कमाल) 332.10s 29.38s
प्रतिसाद वेळ (एकूण) 797.60s 59.86s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#9 GPT-5.5

medium
खर्च
$0.112
वेळ
71.9s
टोकन्स
3,807 tok

#60 Qwen3.7 Plus

none
खर्च
$0.019
वेळ
213.5s
टोकन्स
11,960 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.66s 606 250 1,335
Qwen3.7 Plus 6.5 10.0 50.0% 0 1.38s 696 349 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 8.8 7.8 88.9% 1 59.77s 7,305 362 24,959
Qwen3.7 Plus 5.5 10.0 33.3% 0 2.15s 7,911 639 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 19.29s 11,019 312 2,841
Qwen3.7 Plus 10.0 10.0 100.0% 0 29.38s 14,952 4,505 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.18s 7,140 234 593
Qwen3.7 Plus 10.0 10.0 100.0% 0 1.43s 7,794 243 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 5.3 7.2 44.4% 1 164.14s 723 67 79,625
Qwen3.7 Plus 3.0 10.0 0.0% 0 868ms 789 18 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.16s 477 138 223
Qwen3.7 Plus 5.3 10.0 0.0% 0 1.33s 522 78 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 3.36s 660 93 538
Qwen3.7 Plus 6.3 10.0 50.0% 0 929ms 711 72 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 6.76s 642 241 2,225
Qwen3.7 Plus 7.7 10.0 66.7% 0 1.71s 714 443 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 10.57s 5,445 258 832
Qwen3.7 Plus 10.0 10.0 100.0% 0 3.54s 8,211 222 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 2.8 1.6 33.3% 1 37.86s 195 30 1,754
Qwen3.7 Plus 3.0 10.0 0.0% 0 1.21s 210 9 0

झटपट तुलना

तुलना जोडी बदला