नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Lite vs Google: Gemma 4 31B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-02

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite none रिलीज़: 2026-02-14 Gemma 4 31B Gemma 4 31B medium रिलीज़: 2026-04-02
स्कोर 6.0 8.6
रैंक #57 #5
संगति 7.6 9.6
सही परीक्षण
प्रति प्रयास पास दर 52.9% 80.4%
अस्थिर टेस्ट 5 1
कुल रन 51 51
प्रति परिणाम लागत 0.215 0.109
कुल लागत $0.016 $0.015
???? ??? $0.250 / 1M $0.140 / 1M
????? ??? $2.000 / 1M $0.400 / 1M
आउटपुट टोकन 2,749 9,568
रीजनिंग टोकन 0 22,501
प्रतिक्रिया समय (औसत) 2.40s 21.81s
प्रतिक्रिया समय (अधिकतम) 6.70s 68.92s
प्रतिक्रिया समय (कुल) 40.85s 327.16s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 709 0
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 962 2,046
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 498 0
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 246 0
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 1,822 2,951
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 17 0
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 4,349 8,985
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 105 888
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 533 2,035
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 5.2 4.4 55.6% 2 2.46s 620 0
Gemma 4 31B 8.8 7.9 88.9% 1 27.63s 1,797 5,596
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0

त्वरित तुलना

तुलना जोड़ी बदलें