नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Xiaomi: MiMo-V2-Flash

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-29

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium प्रकाशन: 2026-02-05 MiMo-V2-Flash MiMo-V2-Flash medium प्रकाशन: 2025-12-16
स्कोअर 7.6 7.5
क्रमांक #49 #53
विश्वसनीयता लागू नाही लागू नाही
सुसंगतता 9.1 8.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 70.4% 70.4%
अस्थिर चाचण्या 2 3
एकूण रन 54 54
प्रति निकाल खर्च 12.047 0.341
एकूण खर्च $1.446 $0.038
???? ??? $5.000 / 1M $0.090 / 1M
????? ??? $25.000 / 1M $0.290 / 1M
आउटपुट टोकन्स 29,829 12,387
रिझनिंग टोकन्स 18,938 115,182
प्रतिसाद वेळ (सरासरी) 21.08s 23.36s
प्रतिसाद वेळ (कमाल) 83.40s 96.01s
प्रतिसाद वेळ (एकूण) 231.84s 280.34s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
MiMo-V2-Flash 8.1 7.9 83.3% 1 15.85s 1,674 23,559
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
MiMo-V2-Flash 4.7 1.6 66.7% 1 13.03s 428 3,648
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
MiMo-V2-Flash 9.8 10.0 100.0% 0 75.68s 442 26,859
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
MiMo-V2-Flash 6.5 10.0 50.0% 0 0ms 153 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
MiMo-V2-Flash 5.9 7.2 55.6% 1 96.01s 8,374 42,461
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
MiMo-V2-Flash 4.0 10.0 0.0% 0 4.20s 87 488
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 75 3,504
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
MiMo-V2-Flash 7.7 10.0 66.7% 0 3.77s 833 1,948
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 321 12,715

झटपट तुलना

तुलना जोडी बदला