नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs xAI: Grok 4.20

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-02

मेट्रिक Seed-2.0-Mini Seed-2.0-Mini medium प्रकाशन: 2026-02-14 Grok 4.20 Grok 4.20 medium प्रकाशन: 2026-03-31
स्कोअर 7.3 7.1
क्रमांक #35 #40
सुसंगतता 9.1 8.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 64.7% 66.7%
अस्थिर चाचण्या 2 4
एकूण रन 51 51
प्रति निकाल खर्च 0.281 7.358
एकूण खर्च $0.029 $0.663
???? ??? $0.100 / 1M $2.000 / 1M
????? ??? $0.400 / 1M $6.000 / 1M
आउटपुट टोकन्स 1,971 1,494
रिझनिंग टोकन्स 58,624 97,078
प्रतिसाद वेळ (सरासरी) 60.58s 9.50s
प्रतिसाद वेळ (कमाल) 262.83s 29.87s
प्रतिसाद वेळ (एकूण) 848.16s 161.54s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 360 9,520
Grok 4.20 8.2 7.9 83.3% 1 3.36s 280 8,476
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 246 2,743
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 213 4,210
Grok 4.20 5.8 2.8 66.7% 1 7.09s 47 4,252
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
Grok 4.20 7.3 5.9 83.3% 1 4.42s 40 5,474
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 8.2 7.2 88.9% 1 25.85s 457 5,060
Grok 4.20 6.4 7.7 55.6% 1 3.89s 143 8,028
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620

झटपट तुलना

तुलना जोडी बदला