नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Trinity Large Preview vs Elephant

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-14

मेट्रिक Trinity Large Preview Trinity Large Preview none प्रकाशन: 2026-01-27 मोफत उपलब्ध Elephant Elephant none प्रकाशन: 2026-04-14
स्कोअर 5.3 5.2
क्रमांक #74 #81
सुसंगतता 9.6 9.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 29.6% 31.5%
अस्थिर चाचण्या 1 1
एकूण रन 52 54
प्रति निकाल खर्च 0.000 0.000
एकूण खर्च $0.000 $0.000
???? ??? $0.000 / 1M $0.000 / 1M
????? ??? $0.000 / 1M $0.000 / 1M
आउटपुट टोकन्स 1,985 2,573
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 5.07s 1.23s
प्रतिसाद वेळ (कमाल) 39.47s 3.81s
प्रतिसाद वेळ (एकूण) 91.23s 22.16s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 3.0 10.0 0.0% 0 3.02s 593 0
Elephant 6.6 10.0 50.0% 0 963ms 610 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 6.3 10.0 0.0% 0 39.47s 142 0
Elephant 6.4 3.3 66.7% 1 1.39s 375 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 3.0 10.0 0.0% 0 8.91s 294 0
Elephant 3.0 10.0 0.0% 0 3.81s 731 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 10.0 10.0 100.0% 0 3.26s 186 0
Elephant 6.5 10.0 50.0% 0 1.04s 246 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 5.3 10.0 33.3% 0 877ms 25 0
Elephant 3.0 10.0 0.0% 0 927ms 24 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 4.4 9.9 0.0% 0 2.86s 124 0
Elephant 4.0 10.0 0.0% 0 854ms 106 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 4.1 6.7 16.7% 1 1.09s 63 0
Elephant 9.8 10.0 100.0% 0 1.03s 81 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 5.4 10.0 33.3% 0 3.30s 291 0
Elephant 3.3 10.0 0.0% 0 849ms 170 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
Elephant 3.0 10.0 0.0% 0 2.79s 230 0

झटपट तुलना

तुलना जोडी बदला