नेविगेशन
AI BENCHY
तुलना करें चार्ट Karyapranali
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5 Mini vs Qwen: Qwen3.5-Flash

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-06

मेट्रिक OpenAI: GPT-5 Mini medium रिलीज़: 2025-08-07 Qwen: Qwen3.5-Flash none रिलीज़: 2026-02-24
औसत स्कोर 6.1 4.9
रैंक #32 #41
सही परीक्षण
संगति 8.9 9.5
प्रति परिणाम लागत 1.401 0.088
कुल लागत $0.113 $0.006
प्रति प्रयास पास दर 62.2% 42.2%
अस्थिर टेस्ट 2 1
common.totalRuns 45 (15 x 3) 45 (15 x 3)
आउटपुट टोकन 5,477 3,674
रीजनिंग टोकन 46,912 0
प्रतिक्रिया समय (औसत) 25.92s 3.73s
प्रतिक्रिया समय (अधिकतम) 88.15s 13.73s
प्रतिक्रिया समय (कुल) 388.79s 55.90s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5 Mini 7.0 9.6 66.7% 0 16.45s 1,645 5,824
Qwen: Qwen3.5-Flash 2.3 7.8 11.1% 1 1.62s 687 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5 Mini 10.0 10.0 100.0% 0 88.15s 754 11,520
Qwen: Qwen3.5-Flash 10.0 10.0 0.0% 0 6.22s 1,794 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5 Mini 9.9 10.0 100.0% 0 12.58s 453 3,200
Qwen: Qwen3.5-Flash 9.9 10.0 100.0% 0 1.57s 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5 Mini 10.0 7.2 22.2% 1 44.63s 293 14,016
Qwen: Qwen3.5-Flash 7.0 10.0 66.7% 0 905ms 15 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5 Mini 7.5 6.6 83.3% 1 15.66s 318 4,992
Qwen: Qwen3.5-Flash 5.0 10.0 50.0% 0 8.81s 63 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5 Mini 4.3 9.8 33.3% 0 14.09s 1,527 5,760
Qwen: Qwen3.5-Flash 1.3 10.0 0.0% 0 5.90s 608 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5 Mini 10.0 10.0 100.0% 0 18.64s 487 1,600
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 264 0

त्वरित तुलना

तुलना जोड़ी बदलें