नेव्हिगेशन
AI BENCHY
तुलना करा चार्ट्स Paddhati
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Trinity Large Preview vs Inception: Mercury 2

तुलना करा:

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-06

मेट्रिक Trinity Large Preview none प्रकाशन: 2026-01-27 मोफत उपलब्ध Inception: Mercury 2 medium प्रकाशन: 2026-02-24
क्रमांक #45 #36
सरासरी स्कोअर 4.2 5.3
सुसंगतता 9.6 8.4
प्रति निकाल खर्च 0.000 0.631
एकूण खर्च $0.000 $0.045
बरोबर चाचण्या
प्रति प्रयत्न पास दर 33.3% 54.2%
अस्थिर चाचण्या 1 3
एकूण रन 48 48
आउटपुट टोकन्स 1,837 3,708
रिझनिंग टोकन्स 0 45,921
प्रतिसाद वेळ (सरासरी) 3.15s 2.36s
प्रतिसाद वेळ (कमाल) 8.91s 14.63s
प्रतिसाद वेळ (एकूण) 50.46s 35.39s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 10.0 10.0 0.0% 0 3.59s 587 0
Inception: Mercury 2 7.3 9.8 66.7% 0 1.30s 2,531 2,410
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 10.0 10.0 0.0% 0 8.91s 294 0
Inception: Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 9.9 10.0 100.0% 0 3.26s 186 0
Inception: Mercury 2 5.5 5.9 83.3% 1 1.11s 183 1,656
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 4.0 10.0 33.3% 0 877ms 25 0
Inception: Mercury 2 10.0 7.2 11.1% 1 6.48s 41 30,754
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 3.0 9.9 0.0% 0 2.86s 124 0
Inception: Mercury 2 4.0 10.0 0.0% 0 821ms 137 542
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 3.5 6.7 16.7% 1 1.09s 63 0
Inception: Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 4.0 10.0 33.3% 0 3.30s 291 0
Inception: Mercury 2 1.7 7.5 22.2% 1 934ms 354 2,758
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
Inception: Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956

झटपट तुलना

तुलना जोडी बदला