नेव्हिगेशन
AI BENCHY
तुलना करा चार्ट्स Paddhati
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Trinity Large Preview

तुलना करा:

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-06

मेट्रिक Anthropic: Claude Opus 4.6 medium प्रकाशन: 2026-02-05 Trinity Large Preview none प्रकाशन: 2026-01-27 मोफत उपलब्ध
क्रमांक #26 #45
सरासरी स्कोअर 6.6 4.2
सुसंगतता 9.0 9.6
प्रति निकाल खर्च 13.118 0.000
एकूण खर्च $1.312 $0.000
बरोबर चाचण्या
प्रति प्रयत्न पास दर 66.7% 33.3%
अस्थिर चाचण्या 2 1
एकूण रन 48 48
आउटपुट टोकन्स 26,254 1,837
रिझनिंग टोकन्स 17,363 0
प्रतिसाद वेळ (सरासरी) 22.86s 3.15s
प्रतिसाद वेळ (कमाल) 83.40s 8.91s
प्रतिसाद वेळ (एकूण) 205.71s 50.46s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Anthropic: Claude Opus 4.6 4.0 4.4 55.6% 2 11.88s 897 1,000
Trinity Large Preview 10.0 10.0 0.0% 0 3.59s 587 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Anthropic: Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
Trinity Large Preview 10.0 10.0 0.0% 0 8.91s 294 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Anthropic: Claude Opus 4.6 9.9 10.0 100.0% 0 7.37s 691 757
Trinity Large Preview 9.9 10.0 100.0% 0 3.26s 186 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Anthropic: Claude Opus 4.6 10.0 10.0 0.0% 0 83.40s 14,642 8,687
Trinity Large Preview 4.0 10.0 33.3% 0 877ms 25 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Anthropic: Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
Trinity Large Preview 3.0 9.9 0.0% 0 2.86s 124 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Anthropic: Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
Trinity Large Preview 3.5 6.7 16.7% 1 1.09s 63 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Anthropic: Claude Opus 4.6 7.0 10.0 66.7% 0 4.60s 531 637
Trinity Large Preview 4.0 10.0 33.3% 0 3.30s 291 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Anthropic: Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0

झटपट तुलना

तुलना जोडी बदला