नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Qwen: Qwen3.6 Plus

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-10

मेट्रिक GPT-5.4 GPT-5.4 medium रिलीज़: 2026-03-05 Qwen3.6 Plus Qwen3.6 Plus medium रिलीज़: 2026-04-20
स्कोर 7.9 7.9
रैंक #26 #28
विश्वसनीयता 10.0 10.0
संगति 8.8 9.6
सही परीक्षण
प्रति प्रयास पास दर 75.4% 70.2%
अस्थिर टेस्ट 3 1
कुल रन 57 57
प्रति परिणाम लागत 6.617 0.118
कुल लागत $0.861 $0.016
???? ??? $2.500 / 1M $0.325 / 1M
????? ??? $15.000 / 1M $1.950 / 1M
आउटपुट टोकन 2,199 1,784
रीजनिंग टोकन 50,553 91,543
प्रतिक्रिया समय (औसत) 18.38s 17.06s
प्रतिक्रिया समय (अधिकतम) 100.41s 47.51s
प्रतिक्रिया समय (कुल) 349.21s 307.07s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 8.3 10.0 75.0% 0 4.11s 240 1,511
Qwen3.6 Plus 10.0 10.0 100.0% 0 9.90s 207 7,557
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 13.03s 389 2,045
Qwen3.6 Plus 3.0 10.0 0.0% 0 0ms 0 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
Qwen3.6 Plus 10.0 10.0 100.0% 0 34.95s 452 13,073
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
Qwen3.6 Plus 10.0 10.0 100.0% 0 14.95s 270 10,706
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
Qwen3.6 Plus 2.9 7.2 11.1% 1 29.59s 56 33,464
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
Qwen3.6 Plus 5.1 10.0 0.0% 0 27.05s 111 5,232
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Qwen3.6 Plus 10.0 10.0 100.0% 0 7.54s 102 5,552
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
Qwen3.6 Plus 10.0 10.0 100.0% 0 6.11s 298 6,868
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
Qwen3.6 Plus 10.0 10.0 100.0% 0 5.87s 267 1,330
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.0 10.0 0.0% 0 13.95s 30 1,821
Qwen3.6 Plus 3.0 10.0 0.0% 0 47.51s 21 7,761

त्वरित तुलना

तुलना जोड़ी बदलें