कुल टेस्ट: 4
गलत टेस्ट: 0
Score: 10.00
आउटपुट टोकन: 220
रीजनिंग टोकन: 6,003
| श्रेणी | टेस्ट | गलत | Score | आउटपुट टोकन | रीजनिंग टोकन |
|---|---|---|---|---|---|
| Anti-AI Tricks | 2 | 0 | 10.00 | 201 | 585 |
| Domain specific | 1 | 0 | 10.00 | 0 | 4,865 |
| Puzzle Solving | 1 | 0 | 10.00 | 19 | 553 |
Aibenchy
2026-02-16T02:24:03.805Z
| रैंक | मॉडल नाम | कंपनी ⓘ | Score ⓘ | प्रति परिणाम लागत ⓘ | सही परीक्षण ⓘ | ||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| #1 | Z.ai: GLM 5 तर्क (medium) रिलीज़: रिलीज़ तिथि अज्ञात · कुल लागत: $0.0159816 | Z.ai | 10.00 | 0.3995 | 4/4 | ||||||||||||||||||||||||
| कुल टेस्ट: 4 गलत टेस्ट: 0 Score: 10.00 आउटपुट टोकन: 220 रीजनिंग टोकन: 6,003
| |||||||||||||||||||||||||||||
| #2 | StepFun: Step 3.5 Flash बिना तर्क निःशुल्क उपलब्ध रिलीज़: रिलीज़ तिथि अज्ञात · कुल लागत: $0.0000 | StepFun | 8.00 | 0.0000 | 3/4 | ||||||||||||||||||||||||
| कुल टेस्ट: 4 गलत टेस्ट: 1 Score: 8.00 आउटपुट टोकन: 225 रीजनिंग टोकन: 4,197
| |||||||||||||||||||||||||||||
| #3 | Z.ai: GLM 5 बिना तर्क रिलीज़: रिलीज़ तिथि अज्ञात · कुल लागत: $0.0123402 | Z.ai | 7.75 | 0.4113 | 3/4 | ||||||||||||||||||||||||
| कुल टेस्ट: 4 गलत टेस्ट: 1 Score: 7.75 आउटपुट टोकन: 282 रीजनिंग टोकन: 4,697
| |||||||||||||||||||||||||||||
| #4 | MiniMax: MiniMax M2.5 बिना तर्क रिलीज़: रिलीज़ तिथि अज्ञात · कुल लागत: $0.0142142 | MiniMax | 7.75 | 0.4738 | 3/4 | ||||||||||||||||||||||||
| कुल टेस्ट: 4 गलत टेस्ट: 1 Score: 7.75 आउटपुट टोकन: 101 रीजनिंग टोकन: 15,007
| |||||||||||||||||||||||||||||
| #5 | Z.ai: GLM 4.7 Flash बिना तर्क रिलीज़: रिलीज़ तिथि अज्ञात · कुल लागत: $0.00087212 | Z.ai | 5.50 | 0.0436 | 2/4 | ||||||||||||||||||||||||
| कुल टेस्ट: 4 गलत टेस्ट: 2 Score: 5.50 आउटपुट टोकन: 218 रीजनिंग टोकन: 1,932
| |||||||||||||||||||||||||||||
| #6 | Qwen: Qwen3 Coder Next तर्क (medium) रिलीज़: रिलीज़ तिथि अज्ञात · कुल लागत: $0.00003684 | Qwen | 3.25 | 0.0037 | 1/4 | ||||||||||||||||||||||||
| कुल टेस्ट: 4 गलत टेस्ट: 3 Score: 3.25 आउटपुट टोकन: 64 रीजनिंग टोकन: 0
| |||||||||||||||||||||||||||||
| #7 | Qwen: Qwen3 Coder Next बिना तर्क रिलीज़: रिलीज़ तिथि अज्ञात · कुल लागत: $0.00003894 | Qwen | 3.25 | 0.0039 | 1/4 | ||||||||||||||||||||||||
| कुल टेस्ट: 4 गलत टेस्ट: 3 Score: 3.25 आउटपुट टोकन: 71 रीजनिंग टोकन: 0
| |||||||||||||||||||||||||||||
| #8 | Z.ai: GLM 4.7 Flash तर्क (medium) रिलीज़: रिलीज़ तिथि अज्ञात · कुल लागत: $0.00733692 | Z.ai | 3.25 | 0.7337 | 1/4 | ||||||||||||||||||||||||
| कुल टेस्ट: 4 गलत टेस्ट: 3 Score: 3.25 आउटपुट टोकन: 1,159 रीजनिंग टोकन: 17,192
| |||||||||||||||||||||||||||||
| #9 | MiniMax: MiniMax M2.5 तर्क (medium) रिलीज़: रिलीज़ तिथि अज्ञात · कुल लागत: $0.0225838 | MiniMax | 3.25 | 2.2584 | 1/4 | ||||||||||||||||||||||||
| कुल टेस्ट: 4 गलत टेस्ट: 3 Score: 3.25 आउटपुट टोकन: 46 रीजनिंग टोकन: 22,487
| |||||||||||||||||||||||||||||
| #10 | OpenAI: GPT-4o-mini बिना तर्क रिलीज़: रिलीज़ तिथि अज्ञात · कुल लागत: $0.0000591 | OpenAI | 1.00 | - | 0/4 | ||||||||||||||||||||||||
| कुल टेस्ट: 4 गलत टेस्ट: 4 Score: 1.00 आउटपुट टोकन: 38 रीजनिंग टोकन: 0
| |||||||||||||||||||||||||||||
पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।