AI BENCHY श्रेणी
Samanya Buddhimatta रैंकिंग
देखें कि Samanya Buddhimatta में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: मेट्रिक ↑.
| रैंक | मॉडल | कंपनी | Samanya Buddhimatta स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #47 | Grok Build 0.1 medium | X AI | 4.4 | 7.4 | 0/1 | 18.4s |
| #125 | GPT-5.4 none | OpenAI | 4.4 | 5.5 | 0/1 | 1.78s |
| #143 | MiMo-V2.5 none | Xiaomi | 4.4 | 4.9 | 0/1 | 6.86s |
| #154 | Qwen3.5-9B none | Qwen | 4.4 | 4.6 | 0/1 | 552ms |
| #157 | Grok 4.1 Fast none | X AI | 4.4 | 4.4 | 0/1 | 1.08s |
| #45 | GPT-5.4 Mini medium | OpenAI | 4.5 | 7.5 | 0/1 | 3.72s |
| #54 | GPT-5 Mini medium | OpenAI | 4.5 | 7.3 | 0/1 | 13.5s |
| #70 | GPT-5.4 Nano medium | OpenAI | 4.5 | 7.0 | 0/1 | 4.15s |
| #151 | Trinity Large Preview none | Arcee AI | 4.5 | 4.6 | 0/1 | 873ms |
| #15 | GPT-5.3-Codex medium | OpenAI | 4.6 | 8.4 | 0/1 | 4.87s |
| #63 | GPT-5.3 Chat none | OpenAI | 4.6 | 7.2 | 0/1 | 1.99s |
| #109 | GLM 5V Turbo none | Z.ai | 4.6 | 5.8 | 0/1 | 2.22s |
| #141 | Nemotron 3 Super none | NVIDIA | 4.6 | 4.9 | 0/1 | 950ms |
| #152 | MiMo-V2-Flash none | Xiaomi | 4.6 | 4.6 | 0/1 | 1.67s |
| #25 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 4.7 | 7.9 | 0/1 | 79.9s |