नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.5-Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-17

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini medium प्रकाशन: 2026-03-17 Qwen3.5-Flash Qwen3.5-Flash none प्रकाशन: 2026-02-24
क्रमांक #34 #45
स्कोअर 7.1 6.0
सुसंगतता 7.2 9.6
प्रति निकाल खर्च 3.610 0.077
एकूण खर्च $0.289 $0.006
बरोबर चाचण्या
प्रति प्रयत्न पास दर 68.6% 43.1%
अस्थिर चाचण्या 6 1
एकूण रन 51 51
आउटपुट टोकन्स 1,708 3,777
रिझनिंग टोकन्स 58,019 0
प्रतिसाद वेळ (सरासरी) 15.66s 3.36s
प्रतिसाद वेळ (कमाल) 102.91s 13.73s
प्रतिसाद वेळ (एकूण) 266.14s 57.15s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 296 2,876
Qwen3.5-Flash 3.5 8.3 8.3% 1 1.32s 690 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 317 4,317
Qwen3.5-Flash 3.0 10.0 0.0% 0 6.22s 1,794 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 234 650
Qwen3.5-Flash 10.0 10.0 100.0% 0 1.57s 243 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 60 43,286
Qwen3.5-Flash 7.7 10.0 66.7% 0 905ms 15 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 150 510
Qwen3.5-Flash 10.0 10.0 100.0% 0 803ms 100 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 7.4 6.5 66.7% 1 2.50s 129 1,337
Qwen3.5-Flash 6.3 10.0 50.0% 0 8.81s 63 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 6.8 7.9 55.6% 1 4.33s 271 2,449
Qwen3.5-Flash 3.3 10.0 0.0% 0 5.90s 608 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 251 2,594
Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 264 0

झटपट तुलना

तुलना जोडी बदला