नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 vs Elephant

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-14

मेट्रिक GPT-5.4 GPT-5.4 none प्रकाशन: 2026-03-05 Elephant Elephant medium प्रकाशन: 2026-04-14
स्कोअर 5.9 5.2
क्रमांक #63 #77
सुसंगतता 9.1 9.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 42.6% 29.6%
अस्थिर चाचण्या 2 1
एकूण रन 54 54
प्रति निकाल खर्च 1.477 0.000
एकूण खर्च $0.104 $0.000
???? ??? $2.500 / 1M $0.000 / 1M
????? ??? $15.000 / 1M $0.000 / 1M
आउटपुट टोकन्स 2,317 2,596
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 1.51s 1.27s
प्रतिसाद वेळ (कमाल) 2.95s 3.70s
प्रतिसाद वेळ (एकूण) 27.21s 22.82s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 3.2 8.0 8.3% 1 1.21s 406 0
Elephant 6.6 10.0 50.0% 0 1.19s 815 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 2.95s 480 0
Elephant 5.1 3.3 33.3% 1 1.30s 365 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 3.0 10.0 0.0% 0 2.89s 291 0
Elephant 3.0 10.0 0.0% 0 3.70s 562 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 1.04s 222 0
Elephant 6.5 10.0 50.0% 0 979ms 246 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 5.3 7.2 44.4% 1 1.07s 50 0
Elephant 3.0 10.0 0.0% 0 925ms 24 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 4.4 9.9 0.0% 0 1.78s 184 0
Elephant 4.3 10.0 0.0% 0 920ms 105 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 6.5 10.0 50.0% 0 1.07s 81 0
Elephant 9.8 10.0 100.0% 0 987ms 82 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 5.6 9.8 33.3% 0 1.52s 357 0
Elephant 3.7 10.0 0.0% 0 867ms 166 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Elephant 3.0 10.0 0.0% 0 2.83s 231 0

झटपट तुलना

तुलना जोडी बदला