नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.6 27B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-27

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite none रिलीज़: 2026-02-14 Qwen3.6 27B Qwen3.6 27B medium रिलीज़: 2026-04-20
स्कोर 6.2 7.0
रैंक #78 #60
विश्वसनीयता लागू नहीं 10.0
संगति 7.7 7.9
सही परीक्षण
प्रति प्रयास पास दर 55.6% 64.8%
अस्थिर टेस्ट 5 5
कुल रन 54 54
प्रति परिणाम लागत 0.200 2.321
कुल लागत $0.016 $0.209
???? ??? $0.250 / 1M $0.500 / 1M
????? ??? $2.000 / 1M $2.000 / 1M
आउटपुट टोकन 3,129 8,279
रीजनिंग टोकन 0 91,083
प्रतिक्रिया समय (औसत) 2.53s 50.53s
प्रतिक्रिया समय (अधिकतम) 6.70s 168.22s
प्रतिक्रिया समय (कुल) 45.46s 909.49s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 709 0
Qwen3.6 27B 8.3 10.0 75.0% 0 12.62s 582 4,311
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 4.61s 380 0
Qwen3.6 27B 10.0 10.0 100.0% 0 168.22s 433 17,861
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 498 0
Qwen3.6 27B 7.0 3.7 66.7% 1 83.07s 2,088 14,689
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 246 0
Qwen3.6 27B 3.5 1.4 50.0% 2 37.30s 568 9,404
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 17 0
Qwen3.6 27B 2.9 7.2 11.1% 1 73.38s 3,510 20,352
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Qwen3.6 27B 6.5 3.4 66.7% 1 39.53s 81 3,045
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Qwen3.6 27B 10.0 10.0 100.0% 0 37.96s 346 6,548
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 5.2 4.4 55.6% 2 2.46s 620 0
Qwen3.6 27B 7.7 10.0 66.7% 0 60.21s 281 11,919
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Qwen3.6 27B 10.0 10.0 100.0% 0 16.88s 390 2,954

त्वरित तुलना

तुलना जोड़ी बदलें