नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक GPT-5.4 GPT-5.4 none रिलीज़: 2026-03-05 Qwen3.5-Flash Qwen3.5-Flash none रिलीज़: 2026-02-24
स्कोर 5.9 6.2
रैंक #65 #58
संगति 9.1 9.6
सही परीक्षण
प्रति प्रयास पास दर 42.6% 46.3%
अस्थिर टेस्ट 2 1
कुल रन 54 54
प्रति परिणाम लागत 1.477 0.070
कुल लागत $0.104 $0.006
???? ??? $2.500 / 1M $0.065 / 1M
????? ??? $15.000 / 1M $0.260 / 1M
आउटपुट टोकन 2,317 4,266
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.51s 3.25s
प्रतिक्रिया समय (अधिकतम) 2.95s 13.73s
प्रतिक्रिया समय (कुल) 27.21s 58.44s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.2 8.0 8.3% 1 1.21s 406 0
Qwen3.5-Flash 3.5 8.3 8.3% 1 1.32s 690 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 2.95s 480 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 1.29s 489 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.0 10.0 0.0% 0 2.89s 291 0
Qwen3.5-Flash 3.0 10.0 0.0% 0 6.22s 1,794 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 1.04s 222 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 1.57s 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.3 7.2 44.4% 1 1.07s 50 0
Qwen3.5-Flash 7.7 10.0 66.7% 0 905ms 15 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 4.4 9.9 0.0% 0 1.78s 184 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 803ms 100 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 6.5 10.0 50.0% 0 1.07s 81 0
Qwen3.5-Flash 6.3 10.0 50.0% 0 8.81s 63 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.6 9.8 33.3% 0 1.52s 357 0
Qwen3.5-Flash 3.3 10.0 0.0% 0 5.90s 608 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 264 0

त्वरित तुलना

तुलना जोड़ी बदलें