नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Owl Alpha

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-01

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini none प्रकाशन: 2026-03-17 Owl Alpha Owl Alpha medium प्रकाशन: 2026-04-30
स्कोअर 5.1 5.8
क्रमांक #117 #92
विश्वसनीयता लागू नाही 10.0
सुसंगतता 8.6 9.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 35.2% 40.7%
अस्थिर चाचण्या 3 1
एकूण रन 54 54
प्रति निकाल खर्च 0.630 0.000
एकूण खर्च $0.032 $0.000
???? ??? $0.750 / 1M $0.000 / 1M
????? ??? $4.500 / 1M $0.000 / 1M
आउटपुट टोकन्स 2,418 1,596
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 1.17s 11.04s
प्रतिसाद वेळ (कमाल) 2.52s 58.63s
प्रतिसाद वेळ (एकूण) 21.01s 198.65s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
Owl Alpha 4.8 10.0 25.0% 0 3.97s 87 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.19s 333 0
Owl Alpha 10.0 10.0 100.0% 0 7.35s 402 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
Owl Alpha 3.0 10.0 0.0% 0 10.01s 315 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
Owl Alpha 10.0 10.0 100.0% 0 21.64s 246 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
Owl Alpha 5.3 10.0 33.3% 0 8.58s 28 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
Owl Alpha 4.3 10.0 0.0% 0 58.63s 98 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
Owl Alpha 6.3 10.0 50.0% 0 9.59s 57 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
Owl Alpha 3.4 7.2 11.1% 1 3.44s 135 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0
Owl Alpha 10.0 10.0 100.0% 0 8.26s 228 0

झटपट तुलना

तुलना जोडी बदला