Seed-2.0-Lite

Bytedance Seed रिलीज़: 2026-02-14 परीक्षण किया गया: 2026-04-11 01:44 bytedance-seed/seed-2.0-lite::medium

(medium) (none)

सारांश

Seed-2.0-Lite AI BENCHY पर 8.6 स्कोर करता है और #6 पर है। इसकी reliability लागू नहीं, pass rate 83.3%, कुल लागत $0.121, और औसत response time 30.37s है।

Seed-2.0-Lite को अलग क्या बनाता है: इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है।

स्कोर

8.6

संगति

8.8

विश्वसनीयता

लागू नहीं

कुल लागत (वर्तमान कीमत)

$0.121

कुल आउटपुट टोकन

55,299

कुल इनपुट टोकन

इनपुट कीमत

$0.250 / 1M

आउटपुट कीमत

$2.000 / 1M

सही परीक्षण

गलत टेस्ट: 5

प्रति प्रयास पास दर: 83.3%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

30.37s

प्रतिक्रिया समय (अधिकतम): 168.71s

प्रतिक्रिया समय (कुल): 546.72s

गलत उत्तर: 3 निर्देशों का पालन नहीं किया: 2

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#6 Seed-2.0-Lite

medium

लागत: $0.005
समय: 86.7s
टोकन: 2,354 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 23:12 नया टेस्ट जोड़ा गया	7.9	10.0	$0.234	तुलना करें
2026-06-04 14:30 नया टेस्ट जोड़ा गया	8.2	10.0	$0.175	तुलना करें
2026-05-22 00:37 दोबारा परीक्षण	8.1	10.0	$0.153	तुलना करें
2026-04-11 01:44 पहला दर्ज रन	8.6	लागू नहीं	$0.121	वर्तमान रन

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Seed-2.0-LitemediumvsGPT-5.6 Terrahigh Seed-2.0-LitemediumvsQwen3.7 Plusmedium Seed-2.0-LitemediumvsKimi K3max Seed-2.0-LitemediumvsQwen3.6 Plusmedium Seed-2.0-LitemediumvsInklingmedium Seed-2.0-LitemediumvsGLM 5.2medium Seed-2.0-LitemediumvsGLM 5.2high Seed-2.0-LitemediumvsGPT-5.6 Terramedium Seed-2.0-LitemediumvsGPT-5.2 Chatnone Seed-2.0-LitemediumvsClaude Sonnet 4.6medium

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	8.3	10.0
कोडिंग	10.0	10.0
संयुक्त	10.0	10.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.9	7.2
Samanya Buddhimatta	6.7	3.6
निर्देश पालन	10.0	10.0
पहेली समाधान	9.0	7.9
टूल कॉलिंग	10.0	10.0

Seed-2.0-Lite

Hamster playing table tennis

#6 Seed-2.0-Lite

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल