नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: gpt-oss-120b vs Xiaomi: MiMo-V2.5-Pro

सारांश

gpt-oss-120b vs MiMo-V2.5-Pro benchmark तुलना: gpt-oss-120b average score मध्ये पुढे आहे: 6.1 vs 5.5. gpt-oss-120b चा benchmark खर्च कमी आहे: $0.013 vs $0.017. MiMo-V2.5-Pro वेगवान आहे: 1.78s vs 22.28s, pass rates 52.4% vs 39.7%.

शिफारस केलेले मॉडेल: MiMo-V2.5-Pro - Its score stays close to the best score here (5.5 vs 6.1), while responding about 12.5x faster than gpt-oss-120b.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-04

मेट्रिक gpt-oss-120b gpt-oss-120b medium प्रकाशन: 2025-08-05 मोफत उपलब्ध MiMo-V2.5-Pro MiMo-V2.5-Pro none प्रकाशन: 2026-04-22
स्कोअर 6.1 5.5
क्रमांक #99 #123
विश्वसनीयता 10.0 10.0
सुसंगतता 8.0 8.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 52.4% 39.7%
अस्थिर चाचण्या 5 4
एकूण रन 63 63
प्रति निकाल खर्च 0.141 0.648
एकूण खर्च $0.013 $0.017
इनपुट किंमत $0.039 / 1M $0.435 / 1M
आउटपुट किंमत $0.180 / 1M $0.870 / 1M
एकूण इनपुट टोकन्स 39,084 30,724
आउटपुट टोकन्स 20,013 3,043
रिझनिंग टोकन्स 50,233 0
प्रतिसाद वेळ (सरासरी) 22.28s 1.78s
प्रतिसाद वेळ (कमाल) 68.16s 8.32s
प्रतिसाद वेळ (एकूण) 311.96s 37.42s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#99 gpt-oss-120b

medium
Cost
$0.001
Time
26.7s
Tokens
555 tok

#123 MiMo-V2.5-Pro

none
Cost
$0.004
Time
46.4s
Tokens
4,025 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 1,314 3,518 2,177
MiMo-V2.5-Pro 3.3 8.1 8.3% 1 2.67s 645 994 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 5.9 7.0 55.6% 1 38.37s 7,782 3,365 11,973
MiMo-V2.5-Pro 4.3 7.8 22.2% 1 1.41s 6,559 485 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 11,535 694 5,072
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 3.54s 4,695 596 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 7,476 241 1,114
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 1.32s 7,758 249 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 1,266 6,784 20,606
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 877ms 753 27 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 659 107 387
MiMo-V2.5-Pro 4.0 10.0 0.0% 0 2.58s 498 87 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 1,036 126 1,799
MiMo-V2.5-Pro 6.4 10.0 50.0% 0 1.03s 684 66 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,190 1,790 2,264
MiMo-V2.5-Pro 6.7 4.7 77.8% 2 1.30s 678 267 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 6,514 287 1,083
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.30s 8,238 258 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 312 3,101 3,758
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 1.89s 216 14 0

झटपट तुलना

तुलना जोडी बदला