AI BENCHY
Advertise here

#18

MiMo-V2.5-Pro

Xiaomi रिलीज़: 2026-04-22 परीक्षण किया गया: 2026-05-08 15:28 xiaomi/mimo-v2.5-pro::medium
(medium) (none)

संगति

9.2

कुल आउटपुट टोकन

54,791

???? ???

$1.000 / 1M

????? ???

$3.000 / 1M

सही परीक्षण

गलत टेस्ट: 6

प्रति प्रयास पास दर: 74.1%

अस्थिर टेस्ट

2

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

16.23s

प्रतिक्रिया समय (अधिकतम): 84.22s

प्रतिक्रिया समय (कुल): 292.10s

रन इतिहास

परीक्षण किया गया स्कोर विश्वसनीयता सही परीक्षण कुल लागत तुलना करें
2026-05-08 15:28 सूट बदला गया 8.1 10.0 $0.200 वर्तमान रन
2026-04-22 22:54 पहला दर्ज रन 8.1 लागू नहीं $0.201 तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

श्रेणी स्कोर संगति सही परीक्षण
एंटी-एआई ट्रिक्स 10.0 10.0
कोडिंग 10.0 10.0
संयुक्त 10.0 10.0
डेटा पार्सिंग और निष्कर्षण 7.3 5.8
डोमेन-विशिष्ट 5.3 10.0
Samanya Buddhimatta 5.5 10.0
निर्देश पालन 9.9 10.0
पहेली समाधान 6.7 7.9
टूल कॉलिंग 10.0 10.0

तुलना किए गए मॉडल