नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs Owl Alpha

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-03

मेट्रिक Mercury 2 Mercury 2 none प्रकाशन: 2026-02-24 Owl Alpha Owl Alpha medium प्रकाशन: 2026-04-30
स्कोअर 4.6 5.8
क्रमांक #153 #107
विश्वसनीयता 10.0 10.0
सुसंगतता 9.1 9.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 25.0% 41.7%
अस्थिर चाचण्या 2 1
एकूण रन 60 60
प्रति निकाल खर्च 0.216 0.000
एकूण खर्च $0.009 $0.000
इनपुट किंमत $0.250 / 1M $0.000 / 1M
आउटपुट किंमत $0.750 / 1M $0.000 / 1M
एकूण इनपुट टोकन्स 25,515 40,601
आउटपुट टोकन्स 3,001 2,965
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 614ms 11.64s
प्रतिसाद वेळ (कमाल) 1.27s 58.63s
प्रतिसाद वेळ (एकूण) 12.28s 232.83s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
Owl Alpha 4.8 10.0 25.0% 0 3.97s 1,596 87 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.5 9.4 0.0% 0 831ms 4,631 1,650 0
Owl Alpha 6.6 10.0 50.0% 0 19.08s 3,872 1,754 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
Owl Alpha 3.0 10.0 0.0% 0 10.01s 14,259 315 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
Owl Alpha 10.0 10.0 100.0% 0 21.64s 8,157 246 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
Owl Alpha 5.3 10.0 33.3% 0 8.58s 1,458 28 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
Owl Alpha 4.3 10.0 0.0% 0 58.63s 732 98 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
Owl Alpha 6.5 10.0 50.0% 0 10.15s 1,161 57 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
Owl Alpha 5.3 7.2 44.4% 1 3.40s 1,392 135 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
Owl Alpha 10.0 10.0 100.0% 0 8.26s 7,524 228 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0
Owl Alpha 3.0 10.0 0.0% 0 2.38s 450 17 0

झटपट तुलना

तुलना जोडी बदला