नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Lite vs Qwen3.6 Plus

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-02

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite medium रिलीज़: 2026-02-14 Qwen3.6 Plus Qwen3.6 Plus medium रिलीज़: 2026-04-02 निःशुल्क उपलब्ध
स्कोर 8.5 8.4
रैंक #6 #9
संगति 8.8 9.5
सही परीक्षण
प्रति प्रयास पास दर 82.4% 78.4%
अस्थिर टेस्ट 3 1
कुल रन 51 51
प्रति परिणाम लागत 0.873 0.000
कुल लागत $0.105 $0.000
???? ??? $0.250 / 1M $0.000 / 1M
????? ??? $2.000 / 1M $0.000 / 1M
आउटपुट टोकन 2,821 1,763
रीजनिंग टोकन 44,723 83,782
प्रतिक्रिया समय (औसत) 27.78s 15.27s
प्रतिक्रिया समय (अधिकतम) 168.71s 43.55s
प्रतिक्रिया समय (कुल) 472.24s 259.55s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 996 7,142
Qwen3.6 Plus 10.0 10.0 100.0% 0 9.90s 207 7,557
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
Qwen3.6 Plus 10.0 10.0 100.0% 0 34.95s 452 13,073
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 246 1,742
Qwen3.6 Plus 10.0 10.0 100.0% 0 14.95s 270 10,706
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 15 23,897
Qwen3.6 Plus 2.9 7.2 11.1% 1 29.59s 56 33,464
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 304 1,620
Qwen3.6 Plus 5.1 10.0 0.0% 0 27.05s 111 5,232
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
Qwen3.6 Plus 10.0 10.0 100.0% 0 7.54s 102 5,552
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 9.0 7.9 88.9% 1 11.03s 461 3,532
Qwen3.6 Plus 10.0 10.0 100.0% 0 6.11s 298 6,868
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011
Qwen3.6 Plus 10.0 10.0 100.0% 0 5.87s 267 1,330

त्वरित तुलना

तुलना जोड़ी बदलें