#70 MiMo-V2-Pro
none- लागत
- $0.000
- समय
- 0.1s
- टोकन
- 0 tok
सारांश
Mimo V2 PRO AI BENCHY पर 6.0 स्कोर करता है और #70 पर है। इसकी reliability लागू नहीं, pass rate 48.2%, कुल लागत $0.043, और औसत response time 2.39s है।
Mimo V2 PRO को अलग क्या बनाता है: यह कोडिंग में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि एंटी-एआई ट्रिक्स इसकी सबसे कमजोर जगह है, जहाँ यह #13 पर है।
संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।
पहचान नोट
Hunter Alpha, Mimo V2 PRO का स्टेल्थ संस्करण था।
6.0
संगति
8.6
लागू नहीं
$0.043
कुल आउटपुट टोकन
2,320
कुल इनपुट टोकन
0
इनपुट कीमत
$1.000 / 1M
आउटपुट कीमत
$3.000 / 1M
अस्थिर टेस्ट
3
अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।
जनरेशन शोकेस
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
रन इतिहास
| परीक्षण किया गया | स्कोर | विश्वसनीयता | सही परीक्षण | कुल लागत | तुलना करें |
|---|---|---|---|---|---|
| 2026-06-04 13:47 नया टेस्ट जोड़ा गया | 5.6 | 10.0 | $0.045 ↓ | तुलना करें | |
| 2026-05-22 00:20 सूट बदला गया | 5.7 | 10.0 | $0.047 | तुलना करें | |
| 2026-04-11 01:44 पहला दर्ज रन | 6.0 | लागू नहीं | $0.043 | वर्तमान रन |
रन तुलना
| रन | स्कोर | संगति | विश्वसनीयता | सही परीक्षण | अस्थिर टेस्ट | कुल आउटपुट टोकन | कुल इनपुट टोकन | कुल लागत | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|---|---|---|
| 2026-04-11 01:44 · पहला दर्ज रन | 6.0 | 8.6 | लागू नहीं | 7/18 | 3 | 2,320 | 0 | $0.043 | 2.39s |
| 2026-05-22 00:20 · सूट बदला गया | 5.7 | 8.7 | 10.0 | 7/20 | 3 | 2,371 | 0 | $0.047 | 2.31s |
| अंतर | +0.3 | -0.1 | 0 | 0 | -51 | 0 | -$0.005 | +84ms |
इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।
पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।
| श्रेणी | स्कोर | संगति | सही परीक्षण |
|---|---|---|---|
| एंटी-एआई ट्रिक्स | 3.5 | 8.0 | |
| कोडिंग | 10.0 | 10.0 | |
| संयुक्त | 3.0 | 10.0 | |
| डेटा पार्सिंग और निष्कर्षण | 10.0 | 10.0 | |
| डोमेन-विशिष्ट | 5.3 | 7.2 | |
| Samanya Buddhimatta | 4.3 | 9.9 | |
| निर्देश पालन | 6.5 | 10.0 | |
| पहेली समाधान | 6.0 | 7.1 | |
| टूल कॉलिंग | 10.0 | 10.0 |