नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Qwen: Qwen3.5 Plus 2026-02-15

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक GPT-5.4 GPT-5.4 medium रिलीज़: 2026-03-05 Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none रिलीज़: 2026-02-15
स्कोर 8.2 6.8
रैंक #16 #48
संगति 8.7 9.3
सही परीक्षण
प्रति प्रयास पास दर 79.6% 53.7%
अस्थिर टेस्ट 3 2
कुल रन 54 54
प्रति परिणाम लागत 6.399 0.182
कुल लागत $0.832 $0.017
???? ??? $2.500 / 1M $0.260 / 1M
????? ??? $15.000 / 1M $1.560 / 1M
आउटपुट टोकन 2,169 2,461
रीजनिंग टोकन 48,732 0
प्रतिक्रिया समय (औसत) 18.63s 2.60s
प्रतिक्रिया समय (अधिकतम) 100.41s 6.65s
प्रतिक्रिया समय (कुल) 335.26s 31.23s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 8.3 10.0 75.0% 0 4.11s 240 1,511
Qwen3.5 Plus 2026-02-15 4.8 10.0 25.0% 0 1.91s 517 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 13.03s 389 2,045
Qwen3.5 Plus 2026-02-15 6.3 3.7 33.3% 1 3.63s 443 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 6.65s 314 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.89s 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 1.17s 17 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
Qwen3.5 Plus 2026-02-15 4.4 3.0 33.3% 1 2.26s 117 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.67s 72 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
Qwen3.5 Plus 2026-02-15 7.7 10.0 66.7% 0 2.82s 516 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 3.33s 222 0

त्वरित तुलना

तुलना जोड़ी बदलें