#84

Ling-2.6-flash

Inclusionai रिलीज़: 2026-04-21 परीक्षण किया गया: 2026-04-22 12:55 inclusionai/ling-2.6-flash::none

सारांश

Ling-2.6-flash AI BENCHY पर 5.4 स्कोर करता है और #84 पर है। इसकी reliability लागू नहीं, pass rate 35.2%, कुल लागत $0.000, और औसत response time 11.33s है।

Ling-2.6-flash को अलग क्या बनाता है: यह कोडिंग में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि डेटा पार्सिंग और निष्कर्षण इसकी सबसे कमजोर जगह है, जहाँ यह #18 पर है। इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है।

स्कोर

5.4

संगति

9.5

विश्वसनीयता

लागू नहीं

कुल लागत (वर्तमान कीमत)

$0.000

कुल आउटपुट टोकन

3,338

कुल इनपुट टोकन

इनपुट कीमत

$0.000 / 1M

आउटपुट कीमत

$0.000 / 1M

सही परीक्षण

गलत टेस्ट: 12

प्रति प्रयास पास दर: 35.2%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

11.33s

प्रतिक्रिया समय (अधिकतम): 35.34s

प्रतिक्रिया समय (कुल): 203.88s

गलत उत्तर: 7 निर्देशों का पालन नहीं किया: 3 अमान्य टूल कॉल: 2

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#84 Ling 2.6 Flash

none

Ling-2.6-flash is no longer available as a free model. It has transitioned to a paid model. Continue using it here: https://openrouter.ai/inclusionai/ling-2.6-flash

लागत: $0.000
समय: 0.0s
टोकन: 0 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 23:16 नया टेस्ट जोड़ा गया	4.9	10.0	$0.002 ↑	तुलना करें
2026-06-04 14:30 नया टेस्ट जोड़ा गया	5.0	10.0	$0.001 ↑	तुलना करें
2026-05-22 00:42 सूट बदला गया	5.3	10.0	$0.001	तुलना करें
2026-05-08 15:30 सूट बदला गया	5.3	10.0	$0.001	तुलना करें
2026-04-22 12:55 पहला दर्ज रन	5.4	लागू नहीं	$0.000	वर्तमान रन

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	6.5	10.0
कोडिंग	10.0	10.0
संयुक्त	3.0	10.0
डेटा पार्सिंग और निष्कर्षण	6.5	10.0
डोमेन-विशिष्ट	3.0	10.0
Samanya Buddhimatta	4.1	10.0
निर्देश पालन	9.8	10.0
पहेली समाधान	2.9	7.2
टूल कॉलिंग	3.0	10.0

Ling-2.6-flash

Hamster playing table tennis

#84 Ling 2.6 Flash

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल