नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.5-35B-A3B

सारांश

GPT-5.4 Mini vs Qwen3.5-35B-A3B benchmark तुलना: Qwen3.5-35B-A3B average score में आगे है: 6.3 vs 5.3. GPT-5.4 Mini की benchmark लागत कम है: $0.038 vs $0.401. GPT-5.4 Mini तेज है: 1.13s vs 72.57s, pass rates 30.2% vs 69.8%.

अनुशंसित मॉडल: GPT-5.4 Mini - It offers the best overall trade-off: a competitive score (5.3), lower cost than Qwen3.5-35B-A3B, and balanced response time.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini none रिलीज़: 2026-03-17 Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium रिलीज़: 2026-02-24
स्कोर 5.3 6.3
रैंक #131 #88
विश्वसनीयता 10.0 10.0
संगति 8.8 7.5
सही परीक्षण
प्रति प्रयास पास दर 30.2% 69.8%
अस्थिर टेस्ट 3 6
कुल रन 63 63
प्रति परिणाम लागत 0.743 5.162
कुल लागत $0.038 $0.401
इनपुट कीमत $0.750 / 1M $0.140 / 1M
आउटपुट कीमत $4.500 / 1M $1.000 / 1M
कुल इनपुट टोकन 34,244 42,196
आउटपुट टोकन 2,541 40,630
रीजनिंग टोकन 0 353,577
प्रतिक्रिया समय (औसत) 1.13s 72.57s
प्रतिक्रिया समय (अधिकतम) 2.52s 409.98s
प्रतिक्रिया समय (कुल) 23.82s 1524.04s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#131 GPT-5.4 Mini

none
Cost
$0.010
Time
11.7s
Tokens
2,151 tok

#88 Qwen3.5-35B-A3B

medium
Cost
$0.009
Time
71.4s
Tokens
8,631 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 606 654 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 21.13s 672 798 42,652
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 5.5 10.0 33.3% 0 913ms 7,305 401 0
Qwen3.5-35B-A3B 5.9 9.3 33.3% 0 206.65s 4,106 23,844 111,462
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 11,019 298 0
Qwen3.5-35B-A3B 4.7 1.6 66.7% 1 75.34s 20,992 775 12,485
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 7,140 222 0
Qwen3.5-35B-A3B 7.3 5.9 83.3% 1 59.33s 6,061 235 19,493
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 723 88 0
Qwen3.5-35B-A3B 4.1 4.4 44.5% 2 88.34s 500 41 46,368
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 477 174 0
Qwen3.5-35B-A3B 2.8 1.6 33.3% 1 30.30s 172 20 3,753
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 660 101 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 24.45s 699 97 17,361
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 5.4 10.0 33.3% 0 836ms 642 305 0
Qwen3.5-35B-A3B 8.2 7.2 88.9% 1 33.13s 597 3,592 26,585
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 5,477 255 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 4.65s 8,193 309 1,365
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 1.33s 195 43 0
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 177.35s 204 10,919 72,053

त्वरित तुलना

तुलना जोड़ी बदलें