नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.6 Plus

सारांश

GPT-5.4 Mini vs Qwen3.6 Plus benchmark तुलना: GPT-5.4 Mini average score में आगे है: 8.0 vs 7.8. Qwen3.6 Plus की benchmark लागत कम है: $0.294 vs $0.526. GPT-5.4 Mini तेज है: 22.34s vs 30.70s, pass rates 73.0% vs 69.8%.

अनुशंसित मॉडल: Qwen3.6 Plus - Its score stays close to the best score here (7.8 vs 8.0), while costing about 1.8x less than GPT-5.4 Mini.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-17

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini medium रिलीज़: 2026-03-17 Qwen3.6 Plus Qwen3.6 Plus medium रिलीज़: 2026-04-20
स्कोर 8.0 7.8
रैंक #27 #30
विश्वसनीयता 10.0 10.0
संगति 8.0 9.3
सही परीक्षण
प्रति प्रयास पास दर 73.0% 69.8%
अस्थिर टेस्ट 5 2
कुल रन 63 63
प्रति परिणाम लागत 4.381 0.831
कुल लागत $0.526 $0.294
इनपुट कीमत $0.750 / 1M $0.325 / 1M
आउटपुट कीमत $4.500 / 1M $1.950 / 1M
कुल इनपुट टोकन 34,116 41,565
आउटपुट टोकन 2,181 1,853
रीजनिंग टोकन 108,937 141,973
प्रतिक्रिया समय (औसत) 22.34s 30.70s
प्रतिक्रिया समय (अधिकतम) 138.75s 201.68s
प्रतिक्रिया समय (कुल) 469.20s 613.99s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#27 GPT-5.4 Mini

medium
Cost
$0.056
Time
95.5s
Tokens
12,464 tok

#30 Qwen3.6 Plus

medium
Cost
$0.024
Time
219.0s
Tokens
12,235 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 606 296 2,876
Qwen3.6 Plus 10.0 10.0 100.0% 0 9.90s 672 207 7,557
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 8.4 7.4 88.9% 1 57.87s 7,305 467 40,902
Qwen3.6 Plus 6.1 7.8 44.4% 1 153.12s 7,098 58 50,586
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 11,019 317 4,317
Qwen3.6 Plus 10.0 10.0 100.0% 0 34.95s 14,934 452 13,073
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 7,140 234 650
Qwen3.6 Plus 10.0 10.0 100.0% 0 14.95s 7,782 270 10,706
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 619 60 43,286
Qwen3.6 Plus 2.9 7.2 11.1% 1 29.59s 771 56 33,464
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 477 150 510
Qwen3.6 Plus 5.1 10.0 0.0% 0 27.05s 516 111 5,232
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 9.8 10.0 100.0% 0 2.13s 660 96 1,185
Qwen3.6 Plus 10.0 10.0 100.0% 0 7.54s 699 102 5,552
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 7.8 10.0 66.7% 0 4.37s 642 278 2,443
Qwen3.6 Plus 10.0 10.0 100.0% 0 6.34s 696 309 6,712
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 5,453 251 2,594
Qwen3.6 Plus 10.0 10.0 100.0% 0 5.87s 8,193 267 1,330
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 30.10s 195 32 10,174
Qwen3.6 Plus 3.0 10.0 0.0% 0 47.51s 204 21 7,761

त्वरित तुलना

तुलना जोड़ी बदलें