AI BENCHY श्रेणी
कोडिंग रैंकिंग
देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.
| रैंक | मॉडल | कंपनी | कोडिंग स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #107 | Qwen3.6 27B none | Qwen | 6.8 | 5.8 | 1/2 | 5.75s |
| #110 | MiMo-V2-Pro none | Xiaomi | 6.8 | 5.7 | 1/2 | 2.65s |
| #111 | Owl Alpha none | Openrouter | 7.0 | 5.7 | 1/2 | 39.7s |
| #114 | GPT-5.4 none | OpenAI | 6.8 | 5.6 | 1/2 | 1.99s |
| #116 | Kimi K2.6 none | Moonshot AI | 6.8 | 5.6 | 1/2 | 122.8s |
| #117 | Qwen3.6 Flash none | Qwen | 6.6 | 5.5 | 1/2 | 2.34s |
| #123 | MiniMax M2.7 medium | Minimax | 6.7 | 5.4 | 1/2 | 54.7s |
| #128 | Kimi K2.5 none | Moonshot AI | 6.8 | 5.3 | 1/2 | 36.0s |
| #136 | MiMo-V2.5 none | Xiaomi | 6.8 | 5.0 | 1/2 | 3.74s |
| #137 | GPT-5.4 Mini none | OpenAI | 6.8 | 4.9 | 1/2 | 1.01s |
| #138 | Qwen3.6 35B A3B none | Qwen | 6.8 | 4.9 | 1/2 | 12.3s |
| #2 | Gemini 3.5 Flash high | 10.0 | 9.6 | 2/2 | 24.6s | |
| #5 | Qwen3.7 Max medium | Qwen | 10.0 | 9.0 | 2/2 | 23.0s |
| #7 | Claude Opus 4.7 medium | Anthropic | 10.0 | 8.9 | 2/2 | 14.8s |
| #8 | GPT-5.5 low | OpenAI | 10.0 | 8.9 | 2/2 | 14.4s |