नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.5-27B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-12

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite none रिलीज़: 2026-02-14 Qwen3.5-27B Qwen3.5-27B none रिलीज़: 2026-02-24
रैंक #45 #46
औसत स्कोर 4.9 4.9
संगति 7.4 9.1
प्रति परिणाम लागत 0.214 0.302
कुल लागत $0.015 $0.016
सही परीक्षण
प्रति प्रयास पास दर 56.3% 37.5%
अस्थिर टेस्ट 5 2
कुल रन 48 48
आउटपुट टोकन 2,743 3,161
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 2.49s 1.75s
प्रतिक्रिया समय (अधिकतम) 6.70s 9.39s
प्रतिक्रिया समय (कुल) 39.91s 28.05s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

औसत स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 4.6 22.2% 2 2.93s 703 0
Qwen3.5-27B 4.0 10.0 33.3% 0 796ms 264 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 0.0% 0 6.59s 498 0
Qwen3.5-27B 10.0 1.6 33.3% 1 9.39s 1,461 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 9.9 10.0 100.0% 0 1.82s 246 0
Qwen3.5-27B 9.9 10.0 100.0% 0 1.43s 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 7.2 22.2% 1 1.33s 17 0
Qwen3.5-27B 10.0 10.0 0.0% 0 540ms 15 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Qwen3.5-27B 5.0 10.0 0.0% 0 2.51s 126 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Qwen3.5-27B 4.5 10.0 0.0% 0 815ms 69 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 4.0 4.4 55.6% 2 2.46s 620 0
Qwen3.5-27B 6.3 7.9 55.6% 1 1.37s 680 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Qwen3.5-27B 10.0 10.0 100.0% 0 3.54s 303 0

त्वरित तुलना

तुलना जोड़ी बदलें