नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.5 vs Qwen: Qwen3.5 Plus 2026-02-15

सारांश

GPT-5.5 vs Qwen3.5 Plus 2026-02-15 benchmark तुलना: GPT-5.5 average score में आगे है: 9.3 vs 5.8. Qwen3.5 Plus 2026-02-15 की benchmark लागत कम है: $0.016 vs $0.907. Qwen3.5 Plus 2026-02-15 तेज है: 2.31s vs 9.76s, pass rates 85.7% vs 46.0%.

अनुशंसित मॉडल: GPT-5.5 - It has the strongest score in this comparison (9.3) and the best overall balance of cost and response time across all 2 models.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक GPT-5.5 GPT-5.5 low रिलीज़: 2026-04-24 Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none रिलीज़: 2026-02-15
स्कोर 9.3 5.8
रैंक #4 #106
विश्वसनीयता 10.0 10.0
संगति 10.0 9.4
सही परीक्षण
प्रति प्रयास पास दर 85.7% 46.0%
अस्थिर टेस्ट 0 2
कुल रन 63 63
प्रति परिणाम लागत 5.035 0.204
कुल लागत $0.907 $0.016
इनपुट कीमत $5.000 / 1M $0.260 / 1M
आउटपुट कीमत $30.000 / 1M $1.560 / 1M
कुल इनपुट टोकन 34,209 45,864
आउटपुट टोकन 2,046 2,480
रीजनिंग टोकन 22,460 0
प्रतिक्रिया समय (औसत) 9.76s 2.31s
प्रतिक्रिया समय (अधिकतम) 56.19s 6.65s
प्रतिक्रिया समय (कुल) 204.92s 34.63s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#4 GPT-5.5

low
लागत
$0.068
समय
37.0s
टोकन
2,339 tok

#106 Qwen3.5 Plus 2026-02-15

none
लागत
$0.012
समय
153.2s
टोकन
7,787 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
Qwen3.5 Plus 2026-02-15 4.8 10.0 25.0% 0 1.91s 696 517 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
Qwen3.5 Plus 2026-02-15 4.3 7.9 11.1% 1 2.05s 7,913 473 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 6.65s 18,304 314 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.89s 7,794 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 1.17s 789 17 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
Qwen3.5 Plus 2026-02-15 4.4 3.0 33.3% 1 2.26s 522 117 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.67s 711 72 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
Qwen3.5 Plus 2026-02-15 7.7 10.0 66.7% 0 2.71s 714 494 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 3.33s 8,211 222 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 1.11s 210 11 0

त्वरित तुलना

तुलना जोड़ी बदलें