नेव्हिगेशन
AI BENCHY
तुलना करा चार्ट्स Paddhati
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Trinity Large Preview vs Qwen: Qwen3.5-35B-A3B

तुलना करा:

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-06

मेट्रिक Trinity Large Preview none प्रकाशन: 2026-01-27 मोफत उपलब्ध Qwen: Qwen3.5-35B-A3B none प्रकाशन: 2026-02-24
क्रमांक #45 #42
सरासरी स्कोअर 4.2 4.7
सुसंगतता 9.6 8.6
प्रति निकाल खर्च 0.000 0.237
एकूण खर्च $0.000 $0.015
बरोबर चाचण्या
प्रति प्रयत्न पास दर 33.3% 50.0%
अस्थिर चाचण्या 1 3
एकूण रन 48 (16 x 3) 48 (16 x 3)
आउटपुट टोकन्स 1,837 3,756
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 3.15s 4.10s
प्रतिसाद वेळ (कमाल) 8.91s 47.43s
प्रतिसाद वेळ (एकूण) 50.46s 65.62s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 10.0 10.0 0.0% 0 3.59s 587 0
Qwen: Qwen3.5-35B-A3B 10.0 7.2 22.2% 1 1.76s 569 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 10.0 10.0 0.0% 0 8.91s 294 0
Qwen: Qwen3.5-35B-A3B 10.0 10.0 0.0% 0 47.43s 1,833 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 9.9 10.0 100.0% 0 3.26s 186 0
Qwen: Qwen3.5-35B-A3B 9.9 10.0 100.0% 0 1.16s 243 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 4.0 10.0 33.3% 0 877ms 25 0
Qwen: Qwen3.5-35B-A3B 7.0 10.0 66.7% 0 485ms 15 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 3.0 9.9 0.0% 0 2.86s 124 0
Qwen: Qwen3.5-35B-A3B 6.0 3.4 66.7% 1 1.19s 114 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 3.5 6.7 16.7% 1 1.09s 63 0
Qwen: Qwen3.5-35B-A3B 5.0 10.0 50.0% 0 809ms 63 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 4.0 10.0 33.3% 0 3.30s 291 0
Qwen: Qwen3.5-35B-A3B 1.7 7.4 22.2% 1 1.34s 655 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
Qwen: Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 2.30s 264 0

झटपट तुलना

तुलना जोडी बदला