नेविगेशन
AI BENCHY
तुलना करें चार्ट Karyapranali
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-122B-A10B

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-06

मेट्रिक OpenAI: GPT-5.4 medium रिलीज़: 2026-03-05 Qwen: Qwen3.5-122B-A10B medium रिलीज़: 2026-02-24
औसत स्कोर 8.2 8.2
रैंक #7 #6
सही परीक्षण
संगति 8.9 9.4
प्रति परिणाम लागत 6.533 3.962
कुल लागत $0.784 $0.476
प्रति प्रयास पास दर 86.7% 82.2%
अस्थिर टेस्ट 2 1
common.totalRuns 45 (15 x 3) 45 (15 x 3)
आउटपुट टोकन 1,611 17,226
रीजनिंग टोकन 46,321 138,033
प्रतिक्रिया समय (औसत) 21.06s 29.45s
प्रतिक्रिया समय (अधिकतम) 100.41s 119.29s
प्रतिक्रिया समय (कुल) 315.95s 441.71s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 5.02s 216 1,466
Qwen: Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 6.99s 248 10,486
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
Qwen: Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 107.79s 483 11,337
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 5.32s 234 804
Qwen: Qwen3.5-122B-A10B 9.9 10.0 100.0% 0 23.41s 270 16,558
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 74.27s 61 34,748
Qwen: Qwen3.5-122B-A10B 10.0 7.2 11.1% 1 63.40s 15,537 64,889
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Qwen: Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.88s 77 7,372
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.4 7.0 7.2 88.9% 1 9.13s 442 3,832
Qwen: Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 17.18s 289 26,165
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
Qwen: Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 4.60s 322 1,226

त्वरित तुलना

तुलना जोड़ी बदलें