नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

inclusionAI: Ling-2.6-flash vs MiniMax: MiniMax M2.5

सारांश

Ling-2.6-flash vs MiniMax M2.5 benchmark तुलना: MiniMax M2.5 average score में आगे है: 5.3 vs 5.0. Ling-2.6-flash की benchmark लागत कम है: $0.001 vs $0.385. Ling-2.6-flash तेज है: 9.34s vs 65.37s, pass rates 31.8% vs 46.0%.

अनुशंसित मॉडल: Ling-2.6-flash - Its score stays close to the best score here (5.0 vs 5.3), while costing about 779.4x less than MiniMax M2.5.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-04

मेट्रिक Ling-2.6-flash Ling-2.6-flash none रिलीज़: 2026-04-21 MiniMax M2.5 MiniMax M2.5 medium रिलीज़: 2026-02-12
स्कोर 5.0 5.3
रैंक #138 #129
विश्वसनीयता 10.0 10.0
संगति 9.2 6.5
सही परीक्षण
प्रति प्रयास पास दर 31.8% 46.0%
अस्थिर टेस्ट 2 9
कुल रन 63 63
प्रति परिणाम लागत 0.005 7.900
कुल लागत $0.001 $0.385
इनपुट कीमत $0.010 / 1M $0.150 / 1M
आउटपुट कीमत $0.030 / 1M $1.150 / 1M
कुल इनपुट टोकन 40,718 43,706
आउटपुट टोकन 2,878 109,495
रीजनिंग टोकन 0 330,814
प्रतिक्रिया समय (औसत) 9.34s 65.37s
प्रतिक्रिया समय (अधिकतम) 35.34s 251.36s
प्रतिक्रिया समय (कुल) 177.48s 849.76s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#138 Ling-2.6-flash

none
No showcase result has been generated for this model yet.
Cost
$0.000
Time
-
Tokens
0 tok

#129 MiniMax M2.5

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 6.8 8.1 58.3% 1 11.81s 726 573 0
MiniMax M2.5 7.9 6.3 83.3% 2 20.82s 612 286 45,344
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 5.3 10.0 33.3% 0 11.21s 813 381 0
MiniMax M2.5 3.4 9.1 0.0% 0 188.58s 6,076 357 106,177
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 3.0 10.0 0.0% 0 35.34s 20,818 1,069 0
MiniMax M2.5 4.5 2.1 66.7% 1 60.39s 21,104 740 9,713
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 6.5 10.0 50.0% 0 8.48s 8,004 246 0
MiniMax M2.5 4.6 1.7 66.7% 2 7.48s 6,584 266 3,835
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 3.0 10.0 0.0% 0 4.95s 810 24 0
MiniMax M2.5 2.9 4.4 22.2% 2 237.27s 308 105,047 133,487
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 4.0 10.0 0.0% 0 1.45s 540 109 0
MiniMax M2.5 3.8 2.5 33.3% 1 6.63s 492 25 1,686
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 9.8 10.0 100.0% 0 5.52s 732 81 0
MiniMax M2.5 7.5 10.0 50.0% 0 621ms 699 156 1,495
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 2.9 7.2 11.1% 1 6.51s 729 151 0
MiniMax M2.5 5.3 7.2 44.4% 1 11.21s 495 1,069 9,605
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 3.0 10.0 0.0% 0 18.80s 7,324 229 0
MiniMax M2.5 10.0 10.0 100.0% 0 15.35s 7,123 269 937
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Ling-2.6-flash 3.0 10.0 0.0% 0 1.06s 222 15 0
MiniMax M2.5 3.0 10.0 0.0% 0 80.79s 213 1,280 18,535

त्वरित तुलना

तुलना जोड़ी बदलें