AI BENCHY श्रेणी
Samanya Buddhimatta रैंकिंग
देखें कि Samanya Buddhimatta में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.
| रैंक | मॉडल | कंपनी | Samanya Buddhimatta स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #51 | Nemotron 3 Super medium | NVIDIA | 3.8 | 6.7 | 0/1 | 27.9s |
| #52 | Grok 4.1 Fast medium | X AI | 4.2 | 6.7 | 0/1 | 16.2s |
| #54 | Mercury 2 medium | Inception | 4.8 | 6.5 | 0/1 | 821ms |
| #55 | MiMo-V2-Omni none | Xiaomi | 4.5 | 6.5 | 0/1 | 1.19s |
| #56 | Grok 4.20 Multi Agent Beta medium | X AI | 5.8 | 6.4 | 0/1 | 6.40s |
| #57 | GPT-5 Nano medium | OpenAI | 4.1 | 6.3 | 0/1 | 17.5s |
| #58 | GLM 5V Turbo none | Z.ai | 4.6 | 6.2 | 0/1 | 2.22s |
| #60 | Gemma 4 26B A4B none | 4.0 | 6.2 | 0/1 | 3.54s | |
| #62 | Gemini 2.5 Flash none | 5.0 | 6.2 | 0/1 | 615ms | |
| #63 | Qwen3.5-35B-A3B none | Qwen | 6.5 | 6.1 | 0/1 | 1.19s |
| #65 | MiMo-V2-Pro none | Xiaomi | 4.3 | 6.0 | 0/1 | 2.44s |
| #66 | GPT-5.4 none | OpenAI | 4.4 | 5.9 | 0/1 | 1.78s |
| #67 | Qwen3.5-27B none | Qwen | 5.0 | 5.9 | 0/1 | 2.51s |
| #68 | gpt-oss-120b medium | OpenAI | 4.3 | 5.8 | 0/1 | 7.90s |
| #69 | Kimi K2.6 none | Moonshot AI | 5.4 | 5.8 | 0/1 | 1.55s |