नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.5-9B

सारांश

GPT-5.4 Mini vs Qwen3.5-9B benchmark तुलना: GPT-5.4 Mini average score में आगे है: 5.3 vs 3.8. Qwen3.5-9B की benchmark लागत कम है: $0.036 vs $0.038. GPT-5.4 Mini तेज है: 1.13s vs 82.24s, pass rates 30.2% vs 27.0%.

अनुशंसित मॉडल: GPT-5.4 Mini - It has the best score here (5.3), while responding about 72.5x faster than Qwen3.5-9B.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini none रिलीज़: 2026-03-17 Qwen3.5-9B Qwen3.5-9B medium रिलीज़: 2026-03-02
स्कोर 5.3 3.8
रैंक #124 #165
विश्वसनीयता 10.0 6.7
संगति 8.8 8.0
सही परीक्षण
प्रति प्रयास पास दर 30.2% 27.0%
अस्थिर टेस्ट 3 5
कुल रन 63 63
प्रति परिणाम लागत 0.743 1.187
कुल लागत $0.038 $0.036
इनपुट कीमत $0.750 / 1M $0.100 / 1M
आउटपुट कीमत $4.500 / 1M $0.150 / 1M
कुल इनपुट टोकन 34,244 17,070
आउटपुट टोकन 2,541 29,045
रीजनिंग टोकन 0 209,516
प्रतिक्रिया समय (औसत) 1.13s 82.24s
प्रतिक्रिया समय (अधिकतम) 2.52s 226.38s
प्रतिक्रिया समय (कुल) 23.82s 1315.88s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#124 GPT-5.4 Mini

none
लागत
$0.010
समय
11.7s
टोकन
2,151 tok

#165 Qwen3.5-9B

medium
लागत
$0.001
समय
35.9s
टोकन
3,030 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 606 654 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 369 2,621 12,411
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 5.5 10.0 33.3% 0 913ms 7,305 401 0
Qwen3.5-9B 2.9 10.0 0.0% 0 100.88s 2,396 7,890 41,129
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 11,019 298 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 7,140 222 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 4,722 1,383 32,113
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 723 88 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 295 11,549 48,475
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 477 174 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 180 0 30,695
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 660 101 0
Qwen3.5-9B 6.5 10.0 50.0% 0 5.75s 381 491 1,824
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 5.4 10.0 33.3% 0 836ms 642 305 0
Qwen3.5-9B 3.0 10.0 0.0% 0 32.27s 376 1,593 12,026
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 5,477 255 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 8,283 444 1,149
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 1.33s 195 43 0
Qwen3.5-9B 3.0 10.0 0.0% 0 177.02s 68 3,074 29,694

त्वरित तुलना

तुलना जोड़ी बदलें