नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.5 Plus 2026-02-15

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-17

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini medium रिलीज़: 2026-03-17 Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none रिलीज़: 2026-02-15
रैंक #34 #39
स्कोर 7.1 6.8
संगति 7.2 9.6
प्रति परिणाम लागत 3.610 0.172
कुल लागत $0.289 $0.016
सही परीक्षण
प्रति प्रयास पास दर 68.6% 54.9%
अस्थिर टेस्ट 6 1
कुल रन 51 51
आउटपुट टोकन 1,708 2,018
रीजनिंग टोकन 58,019 0
प्रतिक्रिया समय (औसत) 15.66s 2.51s
प्रतिक्रिया समय (अधिकतम) 102.91s 6.65s
प्रतिक्रिया समय (कुल) 266.14s 27.60s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 296 2,876
Qwen3.5 Plus 2026-02-15 4.8 10.0 25.0% 0 1.91s 517 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 317 4,317
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 6.65s 314 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 234 650
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.89s 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 60 43,286
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 1.17s 17 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 150 510
Qwen3.5 Plus 2026-02-15 4.4 3.0 33.3% 1 2.26s 117 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 7.4 6.5 66.7% 1 2.50s 129 1,337
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.67s 72 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 6.8 7.9 55.6% 1 4.33s 271 2,449
Qwen3.5 Plus 2026-02-15 7.7 10.0 66.7% 0 2.82s 516 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 251 2,594
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 3.33s 222 0

त्वरित तुलना

तुलना जोड़ी बदलें