AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #60 | Gemma 4 26B A4B none | 3.0 | 6.2 | 0/1 | 30.5s | |
| #61 | Seed-2.0-Lite none | Bytedance Seed | 3.0 | 6.2 | 0/1 | 6.59s |
| #62 | Gemini 2.5 Flash none | 3.0 | 6.2 | 0/1 | 4.39s | |
| #63 | Qwen3.5-35B-A3B none | Qwen | 3.0 | 6.1 | 0/1 | 47.4s |
| #64 | DeepSeek V3.2 none | DeepSeek | 6.5 | 6.1 | 0/1 | 115.9s |
| #65 | MiMo-V2-Pro none | Xiaomi | 3.0 | 6.0 | 0/1 | 6.58s |
| #66 | GPT-5.4 none | OpenAI | 3.0 | 5.9 | 0/1 | 2.89s |
| #67 | Qwen3.5-27B none | Qwen | 2.8 | 5.9 | 0/1 | 9.39s |
| #69 | Kimi K2.6 none | Moonshot AI | 3.0 | 5.8 | 0/1 | 3.38s |
| #70 | Qwen3.5-122B-A10B none | Qwen | 3.0 | 5.7 | 0/1 | 46.0s |
| #71 | MiniMax M2.5 medium | Minimax | 4.5 | 5.7 | 0/1 | 60.4s |
| #72 | Hunter Alpha none | OpenRouter | 3.0 | 5.7 | 0/1 | 15.2s |
| #73 | Mistral Small 4 medium | Mistral | 3.0 | 5.7 | 0/1 | 25.3s |
| #74 | GLM 4.7 Flash none | Z.ai | 3.0 | 5.6 | 0/1 | 3.22s |
| #75 | GLM 5.1 none | Z.ai | 2.8 | 5.6 | 0/1 | 32.6s |