नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Qwen: Qwen3.7 Max

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-22

मेट्रिक GPT-5.4 GPT-5.4 medium रिलीज़: 2026-03-05 Qwen3.7 Max Qwen3.7 Max none रिलीज़: 2026-05-22
स्कोर 7.9 7.9
रैंक #28 #27
विश्वसनीयता 10.0 10.0
संगति 8.5 10.0
सही परीक्षण
प्रति प्रयास पास दर 75.0% 70.0%
अस्थिर टेस्ट 4 0
कुल रन 60 60
प्रति परिणाम लागत 8.767 0.719
कुल लागत $1.140 $0.101
???? ??? $2.500 / 1M $2.500 / 1M
????? ??? $15.000 / 1M $7.500 / 1M
आउटपुट टोकन 2,222 1,988
रीजनिंग टोकन 68,503 0
प्रतिक्रिया समय (औसत) 22.31s 1.30s
प्रतिक्रिया समय (अधिकतम) 100.41s 3.92s
प्रतिक्रिया समय (कुल) 446.15s 25.95s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 8.3 10.0 75.0% 0 4.11s 240 1,511
Qwen3.7 Max 6.5 10.0 50.0% 0 1.08s 242 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 8.2 6.7 83.3% 1 54.98s 412 19,995
Qwen3.7 Max 6.8 10.0 50.0% 0 1.39s 576 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
Qwen3.7 Max 3.0 10.0 0.0% 0 2.17s 171 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
Qwen3.7 Max 10.0 10.0 100.0% 0 1.35s 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
Qwen3.7 Max 7.7 10.0 66.7% 0 975ms 15 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
Qwen3.7 Max 10.0 10.0 100.0% 0 1.04s 120 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Qwen3.7 Max 10.0 10.0 100.0% 0 943ms 72 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
Qwen3.7 Max 10.0 10.0 100.0% 0 1.13s 314 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
Qwen3.7 Max 10.0 10.0 100.0% 0 3.92s 222 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.0 10.0 0.0% 0 13.95s 30 1,821
Qwen3.7 Max 3.0 10.0 0.0% 0 856ms 13 0

त्वरित तुलना

तुलना जोड़ी बदलें