नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-Flash

सारांश

GPT-5.4 vs Qwen3.5-Flash benchmark तुलना: Qwen3.5-Flash average score में आगे है: 6.1 vs 5.8. Qwen3.5-Flash की benchmark लागत कम है: $0.005 vs $0.122. GPT-5.4 तेज है: 1.42s vs 3.58s, pass rates 36.5% vs 39.7%.

अनुशंसित मॉडल: Qwen3.5-Flash - It has the best score here (6.1), while costing about 29.5x less than GPT-5.4.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक GPT-5.4 GPT-5.4 none रिलीज़: 2026-03-05 Qwen3.5-Flash Qwen3.5-Flash none रिलीज़: 2026-02-24
स्कोर 5.8 6.1
रैंक #112 #97
विश्वसनीयता 10.0 10.0
संगति 9.2 9.7
सही परीक्षण
प्रति प्रयास पास दर 36.5% 39.7%
अस्थिर टेस्ट 2 1
कुल रन 63 63
प्रति परिणाम लागत 1.740 0.075
कुल लागत $0.122 $0.005
इनपुट कीमत $2.500 / 1M $0.065 / 1M
आउटपुट कीमत $15.000 / 1M $0.260 / 1M
कुल इनपुट टोकन 34,212 46,439
आउटपुट टोकन 2,417 4,276
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.42s 3.58s
प्रतिक्रिया समय (अधिकतम) 2.95s 27.18s
प्रतिक्रिया समय (कुल) 29.87s 75.28s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#112 GPT-5.4

none
लागत
$0.026
समय
18.1s
टोकन
1,792 tok

#97 Qwen3.5-Flash

none
लागत
$0.003
समय
47.4s
टोकन
7,799 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.2 8.0 8.3% 1 1.21s 606 406 0
Qwen3.5-Flash 3.5 8.3 8.3% 1 1.32s 696 690 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.5 10.0 33.3% 0 1.62s 7,305 516 0
Qwen3.5-Flash 5.5 10.0 33.3% 0 850ms 7,913 519 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.0 10.0 0.0% 0 2.89s 11,019 291 0
Qwen3.5-Flash 3.0 10.0 0.0% 0 6.22s 18,879 1,794 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 1.04s 7,140 222 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 1.57s 7,794 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.3 7.2 44.4% 1 1.07s 723 50 0
Qwen3.5-Flash 7.7 10.0 66.7% 0 905ms 789 15 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 4.4 9.9 0.0% 0 1.78s 477 184 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 803ms 522 100 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 6.5 10.0 50.0% 0 1.07s 660 81 0
Qwen3.5-Flash 6.3 10.0 50.0% 0 8.81s 711 63 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.6 9.8 33.3% 0 1.44s 642 381 0
Qwen3.5-Flash 3.1 10.0 0.0% 0 10.89s 714 579 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 2.75s 5,445 246 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 8,211 264 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.0 10.0 0.0% 0 990ms 195 40 0
Qwen3.5-Flash 3.0 10.0 0.0% 0 588ms 210 9 0

त्वरित तुलना

तुलना जोड़ी बदलें