नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Lite vs Mistral: Mistral Small 4

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-17

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite none रिलीज़: 2026-02-14 Mistral Small 4 Mistral Small 4 medium रिलीज़: 2026-03-16
रैंक #47 #55
स्कोर 6.0 5.6
संगति 7.6 7.0
प्रति परिणाम लागत 0.215 0.502
कुल लागत $0.016 $0.026
सही परीक्षण
प्रति प्रयास पास दर 52.9% 49.0%
अस्थिर टेस्ट 5 6
कुल रन 51 51
आउटपुट टोकन 2,749 12,288
रीजनिंग टोकन 0 28,112
प्रतिक्रिया समय (औसत) 2.40s 4.18s
प्रतिक्रिया समय (अधिकतम) 6.70s 25.25s
प्रतिक्रिया समय (कुल) 40.85s 71.03s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 709 0
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 4,055 4,778
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 498 0
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 2,612 10,700
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 246 0
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 335 723
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 17 0
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 2,621 6,904
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 821 828
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 540 1,031
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 5.2 4.4 55.6% 2 2.46s 620 0
Mistral Small 4 3.4 9.7 0.0% 0 2.00s 983 2,338
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 321 810

त्वरित तुलना

तुलना जोड़ी बदलें