नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Arcee AI: Trinity Large Preview vs OpenAI: GPT-5.4 Mini

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-29

मेट्रिक Trinity Large Preview Trinity Large Preview none प्रकाशन: 2026-01-27 GPT-5.4 Mini GPT-5.4 Mini none प्रकाशन: 2026-03-17
स्कोअर 5.3 5.1
क्रमांक #102 #112
विश्वसनीयता लागू नाही लागू नाही
सुसंगतता 9.6 8.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 29.6% 35.2%
अस्थिर चाचण्या 1 3
एकूण रन 52 54
प्रति निकाल खर्च 0.000 0.630
एकूण खर्च $0.000 $0.032
???? ??? $0.150 / 1M $0.750 / 1M
????? ??? $0.450 / 1M $4.500 / 1M
आउटपुट टोकन्स 1,985 2,418
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 5.07s 1.17s
प्रतिसाद वेळ (कमाल) 39.47s 2.52s
प्रतिसाद वेळ (एकूण) 91.23s 21.01s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 3.0 10.0 0.0% 0 3.02s 593 0
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 6.3 10.0 0.0% 0 39.47s 142 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.19s 333 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 3.0 10.0 0.0% 0 8.91s 294 0
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 10.0 10.0 100.0% 0 3.26s 186 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 5.3 10.0 33.3% 0 877ms 25 0
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 4.4 9.9 0.0% 0 2.86s 124 0
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 4.1 6.7 16.7% 1 1.09s 63 0
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 5.4 10.0 33.3% 0 3.30s 291 0
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0

झटपट तुलना

तुलना जोडी बदला