नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Lite vs xAI: Grok 4.1 Fast

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-26

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite none रिलीज़: 2026-02-14 Grok 4.1 Fast Grok 4.1 Fast medium रिलीज़: 2025-11-19
स्कोर 6.2 6.7
रैंक #72 #63
विश्वसनीयता लागू नहीं लागू नहीं
संगति 7.7 7.2
सही परीक्षण
प्रति प्रयास पास दर 55.6% 64.8%
अस्थिर टेस्ट 5 6
कुल रन 54 54
प्रति परिणाम लागत 0.200 0.613
कुल लागत $0.016 $0.056
???? ??? $0.250 / 1M $0.200 / 1M
????? ??? $2.000 / 1M $0.500 / 1M
आउटपुट टोकन 3,129 2,010
रीजनिंग टोकन 0 91,298
प्रतिक्रिया समय (औसत) 2.53s 23.88s
प्रतिक्रिया समय (अधिकतम) 6.70s 121.79s
प्रतिक्रिया समय (कुल) 45.46s 262.66s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 709 0
Grok 4.1 Fast 8.7 7.9 91.7% 1 3.81s 108 4,741
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 4.61s 380 0
Grok 4.1 Fast 2.3 1.1 33.3% 1 23.58s 821 6,703
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 498 0
Grok 4.1 Fast 10.0 10.0 100.0% 0 37.64s 261 12,272
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 246 0
Grok 4.1 Fast 10.0 10.0 100.0% 0 6.63s 180 5,409
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 17 0
Grok 4.1 Fast 5.8 4.4 66.7% 2 121.79s 11 37,657
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Grok 4.1 Fast 4.2 9.9 0.0% 0 16.25s 127 3,456
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Grok 4.1 Fast 6.6 10.0 50.0% 0 5.30s 55 3,489
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 5.2 4.4 55.6% 2 2.46s 620 0
Grok 4.1 Fast 5.3 7.2 44.4% 1 8.08s 187 6,086
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Grok 4.1 Fast 2.8 1.6 33.3% 1 27.71s 260 11,485

त्वरित तुलना

तुलना जोड़ी बदलें