नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Lite vs Laguna M.1

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-29

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite none रिलीज़: 2026-02-14 Laguna M.1 Laguna M.1 medium रिलीज़: 2026-04-28 निःशुल्क उपलब्ध
स्कोर 6.2 6.3
रैंक #79 #74
विश्वसनीयता लागू नहीं 10.0
संगति 7.7 8.6
सही परीक्षण
प्रति प्रयास पास दर 55.6% 53.7%
अस्थिर टेस्ट 5 3
कुल रन 54 54
प्रति परिणाम लागत 0.200 0.000
कुल लागत $0.016 $0.000
???? ??? $0.250 / 1M $0.000 / 1M
????? ??? $2.000 / 1M $0.000 / 1M
आउटपुट टोकन 3,129 63,822
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 2.53s 13.90s
प्रतिक्रिया समय (अधिकतम) 6.70s 53.14s
प्रतिक्रिया समय (कुल) 45.46s 250.28s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 709 0
Laguna M.1 6.6 10.0 50.0% 0 9.15s 7,839 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 4.61s 380 0
Laguna M.1 4.3 1.1 66.7% 1 35.61s 14,327 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 498 0
Laguna M.1 3.0 10.0 0.0% 0 53.14s 12,272 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 246 0
Laguna M.1 10.0 10.0 100.0% 0 4.93s 2,296 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 17 0
Laguna M.1 5.3 7.2 44.4% 1 24.14s 19,020 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Laguna M.1 4.1 10.0 0.0% 0 6.86s 1,294 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Laguna M.1 10.0 10.0 100.0% 0 4.30s 1,626 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 5.2 4.4 55.6% 2 2.46s 620 0
Laguna M.1 3.6 7.2 22.2% 1 6.97s 3,978 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Laguna M.1 10.0 10.0 100.0% 0 6.31s 1,170 0

त्वरित तुलना

तुलना जोड़ी बदलें