नेविगेशन
AI BENCHY
तुलना करें चार्ट Karyapranali
❤️ Made by XCS
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.3 Chat vs Xiaomi: MiMo-V2-Flash

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-06

मेट्रिक OpenAI: GPT-5.3 Chat none रिलीज़: 2026-03-03 Xiaomi: MiMo-V2-Flash medium रिलीज़: 2025-12-16
रैंक #19 #21
औसत स्कोर 7.3 7.2
संगति 8.5 9.5
प्रति परिणाम लागत 3.163 0.316
कुल लागत $0.317 $0.035
सही परीक्षण
प्रति प्रयास पास दर 70.8% 72.9%
अस्थिर टेस्ट 3 1
common.totalRuns 48 (16 x 3) 48 (16 x 3)
आउटपुट टोकन 19,272 11,613
रीजनिंग टोकन 0 106,714
प्रतिक्रिया समय (औसत) 5.96s 25.33s
प्रतिक्रिया समय (अधिकतम) 18.33s 96.01s
प्रतिक्रिया समय (कुल) 95.30s 253.33s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.3 Chat 7.3 7.5 77.8% 1 4.72s 3,091 0
Xiaomi: MiMo-V2-Flash 9.7 10.0 100.0% 0 16.79s 1,328 18,739
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Xiaomi: MiMo-V2-Flash 9.0 10.0 100.0% 0 75.68s 442 26,859
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.3 Chat 9.9 10.0 100.0% 0 2.21s 942 0
Xiaomi: MiMo-V2-Flash 5.5 10.0 50.0% 0 0ms 153 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.3 Chat 10.0 4.4 33.3% 2 13.01s 8,264 0
Xiaomi: MiMo-V2-Flash 4.0 7.2 55.6% 1 96.01s 8,374 42,461
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.3 Chat 4.0 10.0 0.0% 0 1.99s 319 0
Xiaomi: MiMo-V2-Flash 3.0 10.0 0.0% 0 4.20s 87 488
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.3 Chat 9.0 10.0 50.0% 0 3.29s 1,455 0
Xiaomi: MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 75 3,504
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
Xiaomi: MiMo-V2-Flash 7.0 10.0 66.7% 0 3.77s 833 1,948
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
Xiaomi: MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 321 12,715

त्वरित तुलना

तुलना जोड़ी बदलें