नेव्हिगेशन
AI BENCHY
तुलना करा चार्ट्स Paddhati
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Trinity Large Preview vs MiniMax: MiniMax M2.5

तुलना करा:

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-06

मेट्रिक Trinity Large Preview none प्रकाशन: 2026-01-27 मोफत उपलब्ध MiniMax: MiniMax M2.5 medium प्रकाशन: 2026-02-12
क्रमांक #45 #43
सरासरी स्कोअर 4.2 4.7
सुसंगतता 9.6 5.6
प्रति निकाल खर्च 0.000 4.981
एकूण खर्च $0.000 $0.250
बरोबर चाचण्या
प्रति प्रयत्न पास दर 33.3% 60.4%
अस्थिर चाचण्या 1 9
एकूण रन 48 (16 x 3) 48 (16 x 3)
आउटपुट टोकन्स 1,837 107,044
रिझनिंग टोकन्स 0 206,190
प्रतिसाद वेळ (सरासरी) 3.15s 43.03s
प्रतिसाद वेळ (कमाल) 8.91s 237.27s
प्रतिसाद वेळ (एकूण) 50.46s 387.25s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 10.0 10.0 0.0% 0 3.59s 587 0
MiniMax: MiniMax M2.5 9.3 7.9 88.9% 1 32.42s 286 45,112
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 10.0 10.0 0.0% 0 8.91s 294 0
MiniMax: MiniMax M2.5 10.0 2.1 66.7% 1 60.39s 740 9,713
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 9.9 10.0 100.0% 0 3.26s 186 0
MiniMax: MiniMax M2.5 10.0 1.7 66.7% 2 7.48s 266 3,835
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 4.0 10.0 33.3% 0 877ms 25 0
MiniMax: MiniMax M2.5 10.0 4.4 22.2% 2 237.27s 105,047 133,487
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 3.0 9.9 0.0% 0 2.86s 124 0
MiniMax: MiniMax M2.5 3.0 2.5 33.3% 1 6.63s 25 1,686
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 3.5 6.7 16.7% 1 1.09s 63 0
MiniMax: MiniMax M2.5 8.0 6.8 83.3% 1 4.64s 252 1,873
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 4.0 10.0 33.3% 0 3.30s 291 0
MiniMax: MiniMax M2.5 4.0 7.2 44.4% 1 11.54s 159 9,547
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
MiniMax: MiniMax M2.5 10.0 10.0 100.0% 0 15.35s 269 937

झटपट तुलना

तुलना जोडी बदला