AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #112 | Hunter Alpha none | OpenRouter | 3.0 | 5.7 | 0/1 | 0ms |
| #113 | GLM 4.7 Flash none | Z.ai | 5.0 | 5.6 | 0/2 | 3.35s |
| #115 | MiMo-V2.5-Pro none | Xiaomi | 5.0 | 5.6 | 0/2 | 1.80s |
| #118 | MiniMax M2.5 medium | Minimax | 3.5 | 5.5 | 0/2 | 125.8s |
| #119 | gpt-oss-120b none | OpenAI | 4.3 | 5.4 | 0/1 | 9.57s |
| #120 | Grok 4.20 none | X AI | 3.4 | 5.4 | 0/1 | 1.22s |
| #121 | Mistral Small 4 medium | Mistral | 5.1 | 5.4 | 0/2 | 44.8s |
| #122 | Elephant Alpha medium | Openrouter | 4.0 | 5.4 | 0/2 | 1.30s |
| #124 | Laguna M.1 none | Poolside | 7.5 | 5.4 | 0/1 | 2.93s |
| #125 | Qwen3.5-122B-A10B none | Qwen | 4.0 | 5.4 | 0/2 | 2.14s |
| #126 | Nemotron 3 Nano Omni 30b A3b Reasoning medium | NVIDIA | 3.3 | 5.4 | 0/1 | 38.1s |
| #127 | GLM 5 Turbo none | Z.ai | 4.4 | 5.3 | 0/2 | 2.58s |
| #129 | Laguna Xs.2 none | Poolside | 2.5 | 5.3 | 0/1 | 1.96s |
| #131 | Elephant Alpha none | Openrouter | 4.7 | 5.2 | 0/2 | 1.39s |
| #132 | DeepSeek V4 Flash none | DeepSeek | 4.8 | 5.1 | 0/2 | 24.5s |