AI BENCHY
Advertise here
#111

Seed-2.0-Lite

Bytedance Seed प्रकाशन: 2026-02-14 चाचणी तारीख: 2026-06-04 14:17 bytedance-seed/seed-2.0-lite::none
(medium) (none)

सारांश

Seed-2.0-Lite AI BENCHY वर 5.8 स्कोर करते आणि #111 वर आहे. याची reliability 10.0, pass rate 46.0%, एकूण खर्च $0.019, आणि सरासरी response time 2.49s आहे.

Seed-2.0-Lite खास का आहे: हे Samanya Buddhimatta मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर अँटी-एआय युक्त्या हा सर्वात कमकुवत भाग आहे, rank #13.

सुसंगतता

8.4

एकूण आउटपुट टोकन्स

3,259

एकूण इनपुट टोकन्स

46,573

इनपुट किंमत

$0.250 / 1M

आउटपुट किंमत

$2.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 13

प्रति प्रयत्न पास दर: 46.0%

अस्थिर चाचण्या

4

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

2.49s

प्रतिसाद वेळ (कमाल): 6.70s

प्रतिसाद वेळ (एकूण): 52.26s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#111 Seed-2.0-Lite

none
Cost
$0.005
Time
83.8s
Tokens
2,311 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 14:17 नवीन चाचणी जोडली 5.8 10.0 $0.019 सध्याची रन
2026-05-22 00:33 सूट बदलला 5.9 10.0 $0.018 तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन 6.2 लागू नाही $0.016 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 14:17 · सध्याची रन5.88.410.08/2143,25946,573$0.0192.49s
2026-04-11 01:44 · पहिली नोंदलेली रन6.27.7लागू नाही8/1853,1290$0.0162.53s
फरक-0.4+0.70-1+130+46573+$0.003-37ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.250 / 1M $2.000 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 3.0 5.9
कोडिंग 5.6 10.0
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 3.6 7.2
Samanya Buddhimatta 10.0 10.0
सूचनांचे पालन 10.0 10.0
कोडी सोडवणे 5.3 7.2
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स