नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.5-35B-A3B

सारांश

GPT-5.4 Mini vs Qwen3.5-35B-A3B benchmark तुलना: Qwen3.5-35B-A3B average score में आगे है: 5.9 vs 5.3. Qwen3.5-35B-A3B की benchmark लागत कम है: $0.012 vs $0.038. GPT-5.4 Mini तेज है: 1.13s vs 3.37s, pass rates 30.2% vs 42.9%.

अनुशंसित मॉडल: Qwen3.5-35B-A3B - It has the best score here (5.9), while costing about 3.3x less than GPT-5.4 Mini.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini none रिलीज़: 2026-03-17 Qwen3.5-35B-A3B Qwen3.5-35B-A3B none रिलीज़: 2026-02-24
स्कोर 5.3 5.9
रैंक #131 #108
विश्वसनीयता 10.0 10.0
संगति 8.8 8.9
सही परीक्षण
प्रति प्रयास पास दर 30.2% 42.9%
अस्थिर टेस्ट 3 3
कुल रन 63 63
प्रति परिणाम लागत 0.743 0.230
कुल लागत $0.038 $0.012
इनपुट कीमत $0.750 / 1M $0.140 / 1M
आउटपुट कीमत $4.500 / 1M $1.000 / 1M
कुल इनपुट टोकन 34,244 48,194
आउटपुट टोकन 2,541 4,343
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.13s 3.37s
प्रतिक्रिया समय (अधिकतम) 2.52s 47.43s
प्रतिक्रिया समय (कुल) 23.82s 70.75s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#131 GPT-5.4 Mini

none
Cost
$0.010
Time
11.7s
Tokens
2,151 tok

#108 Qwen3.5-35B-A3B

none
Cost
$0.005
Time
28.4s
Tokens
4,518 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 606 654 0
Qwen3.5-35B-A3B 3.4 7.9 16.7% 1 1.43s 696 574 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 5.5 10.0 33.3% 0 913ms 7,305 401 0
Qwen3.5-35B-A3B 5.5 10.0 33.3% 0 1.39s 7,808 571 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 11,019 298 0
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 47.43s 20,739 1,833 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 7,140 222 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 1.16s 7,794 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 723 88 0
Qwen3.5-35B-A3B 7.7 10.0 66.7% 0 485ms 789 15 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 477 174 0
Qwen3.5-35B-A3B 6.5 3.4 66.7% 1 1.19s 522 114 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 660 101 0
Qwen3.5-35B-A3B 6.3 10.0 50.0% 0 809ms 711 63 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 5.4 10.0 33.3% 0 836ms 642 305 0
Qwen3.5-35B-A3B 3.7 7.4 22.2% 1 1.35s 714 655 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 5,477 255 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 2.30s 8,211 264 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 1.33s 195 43 0
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 493ms 210 11 0

त्वरित तुलना

तुलना जोड़ी बदलें