नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.6 Max Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-27

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite medium रिलीज़: 2026-02-14 Qwen3.6 Max Preview Qwen3.6 Max Preview none रिलीज़: 2026-04-20
स्कोर 8.6 7.3
रैंक #10 #56
विश्वसनीयता लागू नहीं 10.0
संगति 8.8 8.7
सही परीक्षण
प्रति प्रयास पास दर 83.3% 66.7%
अस्थिर टेस्ट 3 3
कुल रन 54 54
प्रति परिणाम लागत 0.926 0.827
कुल लागत $0.121 $0.083
???? ??? $0.250 / 1M $1.300 / 1M
????? ??? $2.000 / 1M $7.800 / 1M
आउटपुट टोकन 3,257 4,732
रीजनिंग टोकन 52,042 0
प्रतिक्रिया समय (औसत) 30.37s 3.38s
प्रतिक्रिया समय (अधिकतम) 168.71s 20.51s
प्रतिक्रिया समय (कुल) 546.72s 60.83s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 996 7,142
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 513 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 74.49s 436 7,319
Qwen3.6 Max Preview 5.0 2.0 66.7% 1 3.45s 426 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 2,842 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 246 1,742
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 15 23,897
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 18 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 304 1,620
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 76 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
Qwen3.6 Max Preview 8.4 6.9 83.3% 1 1.45s 69 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 9.0 7.9 88.9% 1 11.03s 461 3,532
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.38s 323 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 222 0

त्वरित तुलना

तुलना जोड़ी बदलें