AI BENCHY
तुलना करें
❤️ Made by XCS

मॉडल नाम

OpenAI: GPT-4o-mini

बेंचमार्क Aibenchy टेस्ट सूट्स से इस समय जनरेट किए गए: : 19 फ़र॰ 2026

मेट्रिक OpenAI: GPT-4o-mini
रैंक#19
कंपनीOpenAI
Score 4.00
संगति 9.98
प्रति परिणाम लागत 0.0576
कुल लागत $0.00173
सही परीक्षण 3/12
प्रति प्रयास पास दर 25.0%
अस्थिर टेस्ट 0
आउटपुट टोकन 570
रीजनिंग टोकन 0

श्रेणी विवरण

श्रेणी पूरी तरह पास टेस्ट Score संगति प्रति प्रयास पास दर अस्थिर टेस्ट तर्क स्कोर लागत
Anti-AI Tricks 0/2 1.00 10.00 0.0% 0 - $0.00005
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 - $0.00115
Domain specific 0/3 1.00 10.00 0.0% 0 - $0.00012
Instructions following 1/2 5.50 10.00 50.0% 0 - $0.00015
Puzzle Solving 0/3 4.00 9.92 0.0% 0 - $0.00028

तुलना किए गए मॉडल

OpenAI: GPT-4o-mini की तुलना इससे करें...

#18 · Stepfun

StepFun: Step 3.5 Flash

तर्क (medium)

Score: 4.92

संगति: 7.34

प्रति प्रयास पास दर: 58.3%

अस्थिर टेस्ट: 4

प्रति परिणाम लागत: 0.0000

सही परीक्षण: 5/12

कुल लागत: $0.00000

तुलना करें

#20 · Z.ai

Z.ai: GLM 4.7 Flash

तर्क (medium)

Score: 3.92

संगति: 6.51

प्रति प्रयास पास दर: 50.0%

अस्थिर टेस्ट: 5

प्रति परिणाम लागत: 0.2253

सही परीक्षण: 4/12

कुल लागत: $0.00902

तुलना करें

#17 · MiniMax

MiniMax: MiniMax M2.5

तर्क (medium)

Score: 5.08

संगति: 6.00

प्रति प्रयास पास दर: 61.1%

अस्थिर टेस्ट: 6

प्रति परिणाम लागत: 4.0276

सही परीक्षण: 5/12

कुल लागत: $0.20138

तुलना करें

त्वरित तुलना

OpenAI: GPT-4o-mini की तुलना इससे करें...