नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.5-27B

सारांश

GPT-5.4 Mini vs Qwen3.5-27B benchmark तुलना: Qwen3.5-27B average score में आगे है: 5.9 vs 5.3. Qwen3.5-27B की benchmark लागत कम है: $0.015 vs $0.038. GPT-5.4 Mini तेज है: 1.13s vs 1.68s, pass rates 30.2% vs 38.1%.

अनुशंसित मॉडल: Qwen3.5-27B - It has the best score here (5.9), while costing about 2.6x less than GPT-5.4 Mini.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini none रिलीज़: 2026-03-17 Qwen3.5-27B Qwen3.5-27B none रिलीज़: 2026-02-24
स्कोर 5.3 5.9
रैंक #131 #109
विश्वसनीयता 10.0 10.0
संगति 8.8 9.3
सही परीक्षण
प्रति प्रयास पास दर 30.2% 38.1%
अस्थिर टेस्ट 3 2
कुल रन 63 63
प्रति परिणाम लागत 0.743 0.249
कुल लागत $0.038 $0.015
इनपुट कीमत $0.750 / 1M $0.195 / 1M
आउटपुट कीमत $4.500 / 1M $1.560 / 1M
कुल इनपुट टोकन 34,244 44,478
आउटपुट टोकन 2,541 3,592
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.13s 1.68s
प्रतिक्रिया समय (अधिकतम) 2.52s 9.39s
प्रतिक्रिया समय (कुल) 23.82s 35.25s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#131 GPT-5.4 Mini

none
Cost
$0.010
Time
11.7s
Tokens
2,151 tok

#109 Qwen3.5-27B

none
Cost
$0.007
Time
42.9s
Tokens
4,273 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 606 654 0
Qwen3.5-27B 4.8 10.0 25.0% 0 788ms 696 267 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 5.5 10.0 33.3% 0 913ms 7,305 401 0
Qwen3.5-27B 5.8 10.0 33.3% 0 1.80s 7,913 415 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 11,019 298 0
Qwen3.5-27B 2.8 1.6 33.3% 1 9.39s 16,918 1,461 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 7,140 222 0
Qwen3.5-27B 10.0 10.0 100.0% 0 1.43s 7,794 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 723 88 0
Qwen3.5-27B 3.0 10.0 0.0% 0 540ms 789 15 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 477 174 0
Qwen3.5-27B 5.0 10.0 0.0% 0 2.51s 522 126 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 660 101 0
Qwen3.5-27B 6.3 10.0 50.0% 0 1.03s 711 69 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 5.4 10.0 33.3% 0 836ms 642 305 0
Qwen3.5-27B 6.7 7.9 55.6% 1 1.38s 714 683 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 5,477 255 0
Qwen3.5-27B 10.0 10.0 100.0% 0 3.54s 8,211 303 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 1.33s 195 43 0
Qwen3.5-27B 3.0 10.0 0.0% 0 599ms 210 10 0

त्वरित तुलना

तुलना जोड़ी बदलें