नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs Inception: Mercury 2

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-04

मेट्रिक Seed-2.0-Mini Seed-2.0-Mini medium प्रकाशन: 2026-02-14 Mercury 2 Mercury 2 medium प्रकाशन: 2026-02-24
स्कोअर 6.9 6.6
क्रमांक #73 #81
विश्वसनीयता 6.7 10.0
सुसंगतता 9.3 8.8
बरोबर चाचण्या
प्रति प्रयत्न पास दर 57.1% 54.0%
अस्थिर चाचण्या 2 3
एकूण रन 63 63
प्रति निकाल खर्च 0.397 0.578
एकूण खर्च $0.044 $0.058
इनपुट किंमत $0.100 / 1M $0.250 / 1M
आउटपुट किंमत $0.400 / 1M $0.750 / 1M
एकूण इनपुट टोकन्स 41,904 35,116
आउटपुट टोकन्स 2,555 4,048
रिझनिंग टोकन्स 95,974 61,219
प्रतिसाद वेळ (सरासरी) 80.22s 2.24s
प्रतिसाद वेळ (कमाल) 262.83s 14.63s
प्रतिसाद वेळ (एकूण) 1363.72s 44.72s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 791 360 9,520
Mercury 2 6.9 9.9 50.0% 0 1.12s 554 2,546 2,609
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 5.5 9.8 33.3% 0 220.48s 3,823 464 34,964
Mercury 2 8.2 7.7 77.8% 1 2.04s 7,065 296 11,328
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 16,533 404 29,806
Mercury 2 10.0 10.0 100.0% 0 3.28s 12,909 268 4,887
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 8,568 246 2,743
Mercury 2 7.3 5.9 83.3% 1 1.11s 6,234 183 1,656
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0 0
Mercury 2 2.9 7.2 11.1% 1 6.48s 695 41 30,754
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 585 213 4,210
Mercury 2 4.8 10.0 0.0% 0 821ms 456 137 542
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 840 69 2,050
Mercury 2 10.0 10.0 100.0% 0 1.07s 340 14 958
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 8.2 7.2 88.9% 1 31.79s 903 527 5,667
Mercury 2 5.4 10.0 33.3% 0 949ms 601 361 2,781
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 9,585 222 5,235
Mercury 2 10.0 10.0 100.0% 0 1.89s 6,080 180 1,956
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 276 50 1,779
Mercury 2 3.0 10.0 0.0% 0 2.58s 182 22 3,748

झटपट तुलना

तुलना जोडी बदला