#140

Cobuddy

Baidu प्रकाशन: 2026-05-06 चाचणी तारीख: 2026-06-04 13:47 baidu/cobuddy::medium

सारांश

Cobuddy AI BENCHY वर 4.9 स्कोर करते आणि #140 वर आहे. याची reliability 10.0, pass rate 47.6%, एकूण खर्च $0.000, आणि सरासरी response time 39.90s आहे.

Cobuddy खास का आहे: हे सूचनांचे पालन मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर डेटा पार्सिंग आणि निष्कर्षण हा सर्वात कमकुवत भाग आहे, rank #12. या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे. हे असामान्यपणे जास्त reasoning tokens वापरते, ज्यामुळे runs हळू किंवा महाग होऊ शकतात.

स्कोअर

4.9

सुसंगतता

7.5

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.000

एकूण आउटपुट टोकन्स

118,380

एकूण इनपुट टोकन्स

37,449

इनपुट किंमत

$0.000 / 1M

आउटपुट किंमत

$0.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 14

प्रति प्रयत्न पास दर: 47.6%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

39.90s

प्रतिसाद वेळ (कमाल): 309.02s

प्रतिसाद वेळ (एकूण): 797.98s

चुकीचे उत्तर: 9 सूचनांचे पालन केले नाही: 3 API त्रुटी: 1 अवैध टूल कॉल: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#140 Cobuddy

medium

No endpoints found for baidu/cobuddy:free.

खर्च: $0.000
वेळ: 0.1s
टोकन्स: 0 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:47 नवीन चाचणी जोडली	5.6	10.0	$0.000	सध्याची रन
2026-05-22 00:23 सूट बदलला	5.7	9.9	$0.000	तुलना करा
2026-05-06 11:30 पहिली नोंदलेली रन	6.0	9.9	$0.000	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख	इनपुट किंमत	आउटपुट किंमत
2026-06-04 15:40	$0.000 / 1M	$0.000 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

CobuddymediumvsDeepSeek V4 Flashnone CobuddymediumvsKimi K2.5none CobuddymediumvsMiMo-V2.5-Pronone CobuddymediumvsGemini 3.5 Flashhigh CobuddymediumvsGemini 3 Flash Previewmedium CobuddymediumvsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध CobuddymediumvsGPT-5.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	8.7	7.9
कोडिंग	3.7	6.7
संयुक्त	3.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	6.3	5.8
डोमेन-विशिष्ट	2.9	4.4
Samanya Buddhimatta	4.2	9.9
सूचनांचे पालन	9.8	10.0
कोडी सोडवणे	3.6	7.2
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Cobuddy

Hamster playing table tennis

#140 Cobuddy

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स