#84

Ling-2.6-flash

Inclusionai प्रकाशन: 2026-04-21 चाचणी तारीख: 2026-04-22 12:55 inclusionai/ling-2.6-flash::none

सारांश

Ling-2.6-flash AI BENCHY वर 5.4 स्कोर करते आणि #84 वर आहे. याची reliability लागू नाही, pass rate 35.2%, एकूण खर्च $0.000, आणि सरासरी response time 11.33s आहे.

Ling-2.6-flash खास का आहे: हे कोडिंग मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर डेटा पार्सिंग आणि निष्कर्षण हा सर्वात कमकुवत भाग आहे, rank #18. या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे.

स्कोअर

5.4

सुसंगतता

9.5

विश्वसनीयता

लागू नाही

एकूण खर्च (सध्याची किंमत)

$0.000

एकूण आउटपुट टोकन्स

3,338

एकूण इनपुट टोकन्स

इनपुट किंमत

$0.000 / 1M

आउटपुट किंमत

$0.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 12

प्रति प्रयत्न पास दर: 35.2%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

11.33s

प्रतिसाद वेळ (कमाल): 35.34s

प्रतिसाद वेळ (एकूण): 203.88s

चुकीचे उत्तर: 7 सूचनांचे पालन केले नाही: 3 अवैध टूल कॉल: 2

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#84 Ling 2.6 Flash

none

Ling-2.6-flash is no longer available as a free model. It has transitioned to a paid model. Continue using it here: https://openrouter.ai/inclusionai/ling-2.6-flash

खर्च: $0.000
वेळ: 0.0s
टोकन्स: 0 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-07-16 23:16 नवीन चाचणी जोडली	4.9	10.0	$0.002 ↑	तुलना करा
2026-06-04 14:30 नवीन चाचणी जोडली	5.0	10.0	$0.001 ↑	तुलना करा
2026-05-22 00:42 सूट बदलला	5.3	10.0	$0.001	तुलना करा
2026-05-08 15:30 सूट बदलला	5.3	10.0	$0.001	तुलना करा
2026-04-22 12:55 पहिली नोंदलेली रन	5.4	लागू नाही	$0.000	सध्याची रन

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-04-22 12:55 · पहिली नोंदलेली रन	5.4	9.5	लागू नाही	6/18	1	3,338	$0.000	11.33s
2026-05-22 00:42 · सूट बदलला	5.3	9.2	10.0	6/19	2	2,878	$0.001	9.76s
फरक	+0.1	+0.3		-1	-1	+460	-$0.001	+1570ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	6.5	10.0
कोडिंग	10.0	10.0
संयुक्त	3.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	6.5	10.0
डोमेन-विशिष्ट	3.0	10.0
Samanya Buddhimatta	4.1	10.0
सूचनांचे पालन	9.8	10.0
कोडी सोडवणे	2.9	7.2
टूल कॉलिंग	3.0	10.0

Ling-2.6-flash

Hamster playing table tennis

#84 Ling 2.6 Flash

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स