नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Qwen: Qwen3.7 Max

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-04

मेट्रिक GPT-5.4 GPT-5.4 medium रिलीज़: 2026-03-05 Qwen3.7 Max Qwen3.7 Max medium रिलीज़: 2026-05-22
स्कोर 8.0 9.1
रैंक #21 #5
विश्वसनीयता 10.0 10.0
संगति 8.6 9.6
सही परीक्षण
प्रति प्रयास पास दर 76.2% 88.9%
अस्थिर टेस्ट 4 1
कुल रन 63 63
प्रति परिणाम लागत 8.640 5.517
कुल लागत $1.210 $0.523
इनपुट कीमत $2.500 / 1M $1.250 / 1M
आउटपुट कीमत $15.000 / 1M $3.750 / 1M
कुल इनपुट टोकन 34,108 42,360
आउटपुट टोकन 2,242 2,129
रीजनिंग टोकन 72,707 122,959
प्रतिक्रिया समय (औसत) 22.35s 16.02s
प्रतिक्रिया समय (अधिकतम) 100.41s 59.98s
प्रतिक्रिया समय (कुल) 469.29s 336.51s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 8.3 10.0 75.0% 0 4.11s 606 240 1,511
Qwen3.7 Max 10.0 10.0 100.0% 0 6.36s 672 222 8,742
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 8.8 7.8 88.9% 1 44.36s 7,305 433 24,216
Qwen3.7 Max 10.0 10.0 100.0% 0 35.31s 7,893 423 34,808
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 20.57s 11,019 301 3,543
Qwen3.7 Max 10.0 10.0 100.0% 0 19.60s 14,934 366 8,405
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 5.32s 7,140 234 804
Qwen3.7 Max 10.0 10.0 100.0% 0 8.80s 7,782 270 6,254
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.3 7.2 44.4% 1 74.27s 619 61 34,748
Qwen3.7 Max 5.9 7.2 55.6% 1 24.94s 771 61 31,793
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 4.7 3.1 33.3% 1 4.92s 477 145 321
Qwen3.7 Max 10.0 10.0 100.0% 0 11.70s 516 135 4,457
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 3.11s 660 93 897
Qwen3.7 Max 10.0 10.0 100.0% 0 7.46s 699 102 5,452
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 8.2 7.2 88.9% 1 9.14s 642 441 3,815
Qwen3.7 Max 10.0 10.0 100.0% 0 8.84s 696 259 8,908
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 13.28s 5,445 264 1,031
Qwen3.7 Max 10.0 10.0 100.0% 0 6.63s 8,193 267 1,220
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.0 10.0 0.0% 0 13.95s 195 30 1,821
Qwen3.7 Max 3.0 10.0 0.0% 0 33.37s 204 24 12,920

त्वरित तुलना

तुलना जोड़ी बदलें