नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.5-9B

सारांश

GPT-5.4 Mini vs Qwen3.5-9B benchmark तुलना: GPT-5.4 Mini average score मध्ये पुढे आहे: 5.3 vs 3.8. Qwen3.5-9B चा benchmark खर्च कमी आहे: $0.036 vs $0.038. GPT-5.4 Mini वेगवान आहे: 1.13s vs 82.24s, pass rates 30.2% vs 27.0%.

शिफारस केलेले मॉडेल: GPT-5.4 Mini - It has the best score here (5.3), while responding about 72.5x faster than Qwen3.5-9B.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini none प्रकाशन: 2026-03-17 Qwen3.5-9B Qwen3.5-9B medium प्रकाशन: 2026-03-02
स्कोअर 5.3 3.8
क्रमांक #124 #165
विश्वसनीयता 10.0 6.7
सुसंगतता 8.8 8.0
बरोबर चाचण्या
प्रति प्रयत्न पास दर 30.2% 27.0%
अस्थिर चाचण्या 3 5
एकूण रन 63 63
प्रति निकाल खर्च 0.743 1.187
एकूण खर्च $0.038 $0.036
इनपुट किंमत $0.750 / 1M $0.100 / 1M
आउटपुट किंमत $4.500 / 1M $0.150 / 1M
एकूण इनपुट टोकन्स 34,244 17,070
आउटपुट टोकन्स 2,541 29,045
रिझनिंग टोकन्स 0 209,516
प्रतिसाद वेळ (सरासरी) 1.13s 82.24s
प्रतिसाद वेळ (कमाल) 2.52s 226.38s
प्रतिसाद वेळ (एकूण) 23.82s 1315.88s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#124 GPT-5.4 Mini

none
खर्च
$0.010
वेळ
11.7s
टोकन्स
2,151 tok

#165 Qwen3.5-9B

medium
खर्च
$0.001
वेळ
35.9s
टोकन्स
3,030 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 606 654 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 369 2,621 12,411
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 5.5 10.0 33.3% 0 913ms 7,305 401 0
Qwen3.5-9B 2.9 10.0 0.0% 0 100.88s 2,396 7,890 41,129
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 11,019 298 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 7,140 222 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 4,722 1,383 32,113
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 723 88 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 295 11,549 48,475
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 477 174 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 180 0 30,695
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 660 101 0
Qwen3.5-9B 6.5 10.0 50.0% 0 5.75s 381 491 1,824
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 5.4 10.0 33.3% 0 836ms 642 305 0
Qwen3.5-9B 3.0 10.0 0.0% 0 32.27s 376 1,593 12,026
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 5,477 255 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 8,283 444 1,149
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.0 10.0 0.0% 0 1.33s 195 43 0
Qwen3.5-9B 3.0 10.0 0.0% 0 177.02s 68 3,074 29,694

झटपट तुलना

तुलना जोडी बदला