#22

Seed-2.0-Lite

Bytedance Seed रिलीज़: 2026-02-14 परीक्षण किया गया: 2026-05-22 00:37 bytedance-seed/seed-2.0-lite::medium

(medium) (none)

सारांश

Seed-2.0-Lite AI BENCHY पर 8.1 स्कोर करता है और #22 पर है। इसकी reliability 10.0, pass rate 75.0%, कुल लागत $0.153, और औसत response time 36.79s है।

Seed-2.0-Lite को अलग क्या बनाता है: इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है।

स्कोर

8.1

संगति

8.9

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.153

कुल आउटपुट टोकन

70,569

कुल इनपुट टोकन

इनपुट कीमत

$0.250 / 1M

आउटपुट कीमत

$2.000 / 1M

सही परीक्षण

गलत टेस्ट: 7

प्रति प्रयास पास दर: 75.0%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

36.79s

प्रतिक्रिया समय (अधिकतम): 168.71s

प्रतिक्रिया समय (कुल): 735.86s

गलत उत्तर: 5 निर्देशों का पालन नहीं किया: 2

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#22 Seed-2.0-Lite

medium

लागत: $0.005
समय: 86.7s
टोकन: 2,354 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 23:12 नया टेस्ट जोड़ा गया	7.9	10.0	$0.234	तुलना करें
2026-06-04 14:30 नया टेस्ट जोड़ा गया	8.2	10.0	$0.175	तुलना करें
2026-05-22 00:37 दोबारा परीक्षण	8.1	10.0	$0.153	वर्तमान रन
2026-04-11 01:44 पहला दर्ज रन	8.6	लागू नहीं	$0.121	तुलना करें

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-05-22 00:37 · दोबारा परीक्षण	8.1	8.9	10.0	13/20	3	70,569	$0.153	36.79s
2026-04-11 01:44 · पहला दर्ज रन	8.6	8.8	लागू नहीं	13/18	3	55,299	$0.121	30.37s
अंतर	-0.5	+0.1		0	0	+15270	+$0.032	+6420ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Seed-2.0-LitemediumvsGPT-5.6 Terrahigh Seed-2.0-LitemediumvsQwen3.7 Plusmedium Seed-2.0-LitemediumvsKimi K3max Seed-2.0-LitemediumvsQwen3.6 Plusmedium Seed-2.0-LitemediumvsInklingmedium Seed-2.0-LitemediumvsGLM 5.2medium Seed-2.0-LitemediumvsGLM 5.2high Seed-2.0-LitemediumvsGPT-5.6 Terramedium Seed-2.0-LitemediumvsGPT-5.2 Chatnone Seed-2.0-LitemediumvsClaude Sonnet 4.6medium

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	8.3	10.0
कोडिंग	7.0	9.7
संयुक्त	10.0	10.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.9	7.2
Samanya Buddhimatta	6.7	3.6
निर्देश पालन	10.0	10.0
पहेली समाधान	9.0	7.9
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Seed-2.0-Lite

Hamster playing table tennis

#22 Seed-2.0-Lite

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल