नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

inclusionAI: Ling-2.6-flash vs Mistral: Mistral Small 4

सारांश

Ling-2.6-flash vs Mistral Small 4 benchmark तुलना: Mistral Small 4 average score मध्ये पुढे आहे: 5.3 vs 5.0. Ling-2.6-flash चा benchmark खर्च कमी आहे: $0.001 vs $0.068. Ling-2.6-flash वेगवान आहे: 9.34s vs 9.40s, pass rates 31.8% vs 44.4%.

शिफारस केलेले मॉडेल: Ling-2.6-flash - Its score stays close to the best score here (5.0 vs 5.3), while costing about 136.1x less than Mistral Small 4.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-04

मेट्रिक Ling-2.6-flash Ling-2.6-flash none प्रकाशन: 2026-04-21 Mistral Small 4 Mistral Small 4 medium प्रकाशन: 2026-03-16
स्कोअर 5.0 5.3
क्रमांक #138 #132
विश्वसनीयता 10.0 10.0
सुसंगतता 9.2 6.9
बरोबर चाचण्या
प्रति प्रयत्न पास दर 31.8% 44.4%
अस्थिर चाचण्या 2 8
एकूण रन 63 63
प्रति निकाल खर्च 0.005 1.344
एकूण खर्च $0.001 $0.068
इनपुट किंमत $0.010 / 1M $0.150 / 1M
आउटपुट किंमत $0.030 / 1M $0.600 / 1M
एकूण इनपुट टोकन्स 40,718 42,576
आउटपुट टोकन्स 2,878 24,184
रिझनिंग टोकन्स 0 84,678
प्रतिसाद वेळ (सरासरी) 9.34s 9.40s
प्रतिसाद वेळ (कमाल) 35.34s 59.15s
प्रतिसाद वेळ (एकूण) 177.48s 197.39s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#138 Ling-2.6-flash

none
No showcase result has been generated for this model yet.
Cost
$0.000
Time
-
Tokens
0 tok

#132 Mistral Small 4

medium
Cost
$0.006
Time
47.9s
Tokens
9,857 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Ling-2.6-flash 6.8 8.1 58.3% 1 11.81s 726 573 0
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 708 4,055 4,778
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Ling-2.6-flash 5.3 10.0 33.3% 0 11.21s 813 381 0
Mistral Small 4 4.4 5.1 33.3% 2 39.98s 7,636 11,635 54,715
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Ling-2.6-flash 3.0 10.0 0.0% 0 35.34s 20,818 1,069 0
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 18,706 2,612 10,700
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Ling-2.6-flash 6.5 10.0 50.0% 0 8.48s 8,004 246 0
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 6,171 335 723
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Ling-2.6-flash 3.0 10.0 0.0% 0 4.95s 810 24 0
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 742 2,621 6,904
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Ling-2.6-flash 4.0 10.0 0.0% 0 1.45s 540 109 0
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 519 821 828
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Ling-2.6-flash 9.8 10.0 100.0% 0 5.52s 732 81 0
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 729 540 1,031
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Ling-2.6-flash 2.9 7.2 11.1% 1 6.51s 729 151 0
Mistral Small 4 3.4 9.7 0.0% 0 2.17s 735 1,226 2,632
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Ling-2.6-flash 3.0 10.0 0.0% 0 18.80s 7,324 229 0
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 6,420 321 810
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Ling-2.6-flash 3.0 10.0 0.0% 0 1.06s 222 15 0
Mistral Small 4 3.0 10.0 0.0% 0 5.92s 210 18 1,557

झटपट तुलना

तुलना जोडी बदला