नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.5-9B

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-17

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini none प्रकाशन: 2026-03-17 Qwen3.5-9B Qwen3.5-9B none प्रकाशन: 2026-03-02
क्रमांक #66 #67
स्कोअर 4.8 4.8
सुसंगतता 8.6 10.0
प्रति निकाल खर्च 0.737 0.111
एकूण खर्च $0.030 $0.005
बरोबर चाचण्या
प्रति प्रयत्न पास दर 31.4% 23.5%
अस्थिर चाचण्या 3 0
एकूण रन 51 51
आउटपुट टोकन्स 2,085 2,945
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 1.17s 1.22s
प्रतिसाद वेळ (कमाल) 2.52s 5.91s
प्रतिसाद वेळ (एकूण) 19.82s 20.74s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
Qwen3.5-9B 3.1 9.9 0.0% 0 1.71s 582 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
Qwen3.5-9B 3.0 10.0 0.0% 0 5.91s 1,255 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
Qwen3.5-9B 10.0 10.0 100.0% 0 847ms 249 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
Qwen3.5-9B 3.0 10.0 0.0% 0 464ms 24 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
Qwen3.5-9B 4.4 9.9 0.0% 0 552ms 99 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
Qwen3.5-9B 6.5 10.0 50.0% 0 514ms 75 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
Qwen3.5-9B 3.2 9.9 0.0% 0 683ms 388 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0
Qwen3.5-9B 10.0 10.0 100.0% 0 1.27s 273 0

झटपट तुलना

तुलना जोडी बदला