नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.5 vs Qwen: Qwen3.5 Plus 2026-02-15

सारांश

GPT-5.5 vs Qwen3.5 Plus 2026-02-15 benchmark तुलना: GPT-5.5 average score मध्ये पुढे आहे: 6.3 vs 5.8. Qwen3.5 Plus 2026-02-15 चा benchmark खर्च कमी आहे: $0.016 vs $0.231. GPT-5.5 वेगवान आहे: 1.89s vs 2.31s, pass rates 54.0% vs 46.0%.

शिफारस केलेले मॉडेल: Qwen3.5 Plus 2026-02-15 - Its score stays close to the best score here (5.8 vs 6.3), while costing about 14.6x less than GPT-5.5.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक GPT-5.5 GPT-5.5 none प्रकाशन: 2026-04-24 Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none प्रकाशन: 2026-02-15
स्कोअर 6.3 5.8
क्रमांक #90 #106
विश्वसनीयता 10.0 10.0
सुसंगतता 8.8 9.4
बरोबर चाचण्या
प्रति प्रयत्न पास दर 54.0% 46.0%
अस्थिर चाचण्या 3 2
एकूण रन 63 63
प्रति निकाल खर्च 2.302 0.204
एकूण खर्च $0.231 $0.016
इनपुट किंमत $5.000 / 1M $0.260 / 1M
आउटपुट किंमत $30.000 / 1M $1.560 / 1M
एकूण इनपुट टोकन्स 34,212 45,864
आउटपुट टोकन्स 1,971 2,480
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 1.89s 2.31s
प्रतिसाद वेळ (कमाल) 5.56s 6.65s
प्रतिसाद वेळ (एकूण) 39.64s 34.63s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#90 GPT-5.5

none
खर्च
$0.090
वेळ
54.3s
टोकन्स
3,063 tok

#106 Qwen3.5 Plus 2026-02-15

none
खर्च
$0.012
वेळ
153.2s
टोकन्स
7,787 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 6.9 7.9 66.7% 1 1.31s 606 213 0
Qwen3.5 Plus 2026-02-15 4.8 10.0 25.0% 0 1.91s 696 517 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 5.5 10.0 33.3% 0 1.35s 7,305 462 0
Qwen3.5 Plus 2026-02-15 4.3 7.9 11.1% 1 2.05s 7,913 473 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 3.0 10.0 0.0% 0 5.56s 11,019 300 0
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 6.65s 18,304 314 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 1.18s 7,140 222 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.89s 7,794 243 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 2.9 7.2 11.1% 1 1.31s 723 52 0
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 1.17s 789 17 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 3.41s 477 124 0
Qwen3.5 Plus 2026-02-15 4.4 3.0 33.3% 1 2.26s 522 117 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 6.2 5.8 66.7% 1 1.15s 660 81 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.67s 711 72 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 7.7 10.0 66.7% 0 1.29s 642 252 0
Qwen3.5 Plus 2026-02-15 7.7 10.0 66.7% 0 2.71s 714 494 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 3.90s 5,445 247 0
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 3.33s 8,211 222 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 3.0 10.0 0.0% 0 5.01s 195 18 0
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 1.11s 210 11 0

झटपट तुलना

तुलना जोडी बदला