नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Inception: Mercury 2 vs inclusionAI: Ling-2.6-flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-03

मेट्रिक Mercury 2 Mercury 2 none प्रकाशन: 2026-02-24 Ling-2.6-flash Ling-2.6-flash none प्रकाशन: 2026-04-21
स्कोअर 4.6 5.2
क्रमांक #153 #135
विश्वसनीयता 10.0 10.0
सुसंगतता 9.1 9.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 25.0% 33.3%
अस्थिर चाचण्या 2 2
एकूण रन 60 60
प्रति निकाल खर्च 0.216 0.005
एकूण खर्च $0.009 $0.001
इनपुट किंमत $0.250 / 1M $0.010 / 1M
आउटपुट किंमत $0.750 / 1M $0.030 / 1M
एकूण इनपुट टोकन्स 25,515 40,718
आउटपुट टोकन्स 3,001 2,878
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 614ms 9.34s
प्रतिसाद वेळ (कमाल) 1.27s 35.34s
प्रतिसाद वेळ (एकूण) 12.28s 177.48s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
Ling-2.6-flash 6.8 8.1 58.3% 1 11.81s 726 573 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.5 9.4 0.0% 0 831ms 4,631 1,650 0
Ling-2.6-flash 6.5 10.0 50.0% 0 11.21s 813 381 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
Ling-2.6-flash 3.0 10.0 0.0% 0 35.34s 20,818 1,069 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
Ling-2.6-flash 6.5 10.0 50.0% 0 8.48s 8,004 246 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
Ling-2.6-flash 3.0 10.0 0.0% 0 4.95s 810 24 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
Ling-2.6-flash 4.0 10.0 0.0% 0 1.45s 540 109 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
Ling-2.6-flash 9.8 10.0 100.0% 0 5.52s 732 81 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
Ling-2.6-flash 2.9 7.2 11.1% 1 6.51s 729 151 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
Ling-2.6-flash 3.0 10.0 0.0% 0 18.80s 7,324 229 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0
Ling-2.6-flash 3.0 10.0 0.0% 0 1.06s 222 15 0

झटपट तुलना

तुलना जोडी बदला