नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.5-9B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-17

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini none रिलीज़: 2026-03-17 Qwen3.5-9B Qwen3.5-9B none रिलीज़: 2026-03-02
रैंक #66 #67
स्कोर 4.8 4.8
संगति 8.6 10.0
प्रति परिणाम लागत 0.737 0.111
कुल लागत $0.030 $0.005
सही परीक्षण
प्रति प्रयास पास दर 31.4% 23.5%
अस्थिर टेस्ट 3 0
कुल रन 51 51
आउटपुट टोकन 2,085 2,945
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.17s 1.22s
प्रतिक्रिया समय (अधिकतम) 2.52s 5.91s
प्रतिक्रिया समय (कुल) 19.82s 20.74s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
Qwen3.5-9B 3.1 9.9 0.0% 0 1.71s 582 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
Qwen3.5-9B 3.0 10.0 0.0% 0 5.91s 1,255 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
Qwen3.5-9B 10.0 10.0 100.0% 0 847ms 249 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
Qwen3.5-9B 3.0 10.0 0.0% 0 464ms 24 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
Qwen3.5-9B 4.4 9.9 0.0% 0 552ms 99 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
Qwen3.5-9B 6.5 10.0 50.0% 0 514ms 75 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
Qwen3.5-9B 3.2 9.9 0.0% 0 683ms 388 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0
Qwen3.5-9B 10.0 10.0 100.0% 0 1.27s 273 0

त्वरित तुलना

तुलना जोड़ी बदलें