AI BENCHY
Advertise here

#77

Seed-2.0-Mini

Bytedance Seed रिलीज़: 2026-02-14 परीक्षण किया गया: 2026-05-22 00:44 bytedance-seed/seed-2.0-mini::medium

संगति

9.2

कुल आउटपुट टोकन

98,529

कुल इनपुट टोकन

41,904

इनपुट कीमत

$0.100 / 1M

आउटपुट कीमत

$0.400 / 1M

सही परीक्षण

गलत टेस्ट: 9

प्रति प्रयास पास दर: 60.0%

अस्थिर टेस्ट

2

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

80.22s

प्रतिक्रिया समय (अधिकतम): 262.83s

प्रतिक्रिया समय (कुल): 1363.72s

रन इतिहास

परीक्षण किया गया स्कोर विश्वसनीयता सही परीक्षण कुल लागत तुलना करें
2026-05-22 00:44 सूट बदला गया 7.1 5.0 $0.044 वर्तमान रन
2026-04-11 01:44 पहला दर्ज रन 7.5 लागू नहीं $0.037 तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रनस्कोरसंगतिविश्वसनीयतासही परीक्षणअस्थिर टेस्टकुल आउटपुट टोकनकुल इनपुट टोकनकुल लागतप्रतिक्रिया समय (औसत)
2026-05-22 00:44 · वर्तमान रन7.19.210.011/20298,52941,904$0.04480.22s
2026-04-11 01:44 · पहला दर्ज रन7.59.2लागू नहीं11/18281,6570$0.03769.70s
अंतर-0.50.000+16872+41904+$0.008+10521ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख इनपुट कीमत आउटपुट कीमत
2026-06-01 11:25 $0.100 / 1M $0.400 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

श्रेणी स्कोर संगति सही परीक्षण
एंटी-एआई ट्रिक्स 6.6 10.0
कोडिंग 6.8 9.8
संयुक्त 10.0 10.0
डेटा पार्सिंग और निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 3.0 10.0
Samanya Buddhimatta 5.1 3.4
निर्देश पालन 10.0 10.0
पहेली समाधान 8.2 7.2
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना किए गए मॉडल