नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.5-9B

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-17

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini none प्रकाशन: 2026-03-17 Qwen3.5-9B Qwen3.5-9B medium प्रकाशन: 2026-03-02
क्रमांक #66 #70
स्कोअर 4.8 4.5
सुसंगतता 8.6 7.0
प्रति निकाल खर्च 0.737 0.787
एकूण खर्च $0.030 $0.024
बरोबर चाचण्या
प्रति प्रयत्न पास दर 31.4% 35.3%
अस्थिर चाचण्या 3 6
एकूण रन 51 51
आउटपुट टोकन्स 2,085 18,141
रिझनिंग टोकन्स 0 141,204
प्रतिसाद वेळ (सरासरी) 1.17s 69.21s
प्रतिसाद वेळ (कमाल) 2.52s 226.38s
प्रतिसाद वेळ (एकूण) 19.82s 968.99s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 2,621 12,411
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 1,383 32,113
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 11,549 48,475
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 0 30,695
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
Qwen3.5-9B 6.4 5.8 66.7% 1 17.15s 599 4,517
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
Qwen3.5-9B 3.1 10.0 0.0% 0 33.38s 1,545 11,844
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 444 1,149

झटपट तुलना

तुलना जोडी बदला