AI BENCHY श्रेणी
Samanya Buddhimatta रैंकिंग
देखें कि Samanya Buddhimatta में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.
| रैंक | मॉडल | कंपनी | Samanya Buddhimatta स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #79 | Hunter Alpha medium | OpenRouter | 7.0 | 6.7 | 0/1 | 6.44s |
| #80 | Mimo V2 Omni medium | Xiaomi | 5.4 | 6.7 | 0/1 | 3.61s |
| #81 | Mercury 2 medium | Inception | 4.8 | 6.6 | 0/1 | 821ms |
| #82 | Hy3 preview high | Tencent | 3.0 | 6.6 | 0/1 | 0ms |
| #83 | Step 3.5 Flash none | Stepfun | 4.0 | 6.6 | 0/1 | 14.4s |
| #84 | Grok 4.20 Multi Agent Beta medium | X AI | 5.8 | 6.6 | 0/1 | 6.40s |
| #86 | Grok 4.1 Fast medium | X AI | 4.2 | 6.5 | 0/1 | 16.2s |
| #87 | Gemini 3.1 Flash Lite minimal | 4.0 | 6.4 | 0/1 | 791ms | |
| #88 | Qwen3.7 Plus none | Qwen | 5.3 | 6.4 | 0/1 | 1.33s |
| #89 | Hy3 preview low | Tencent | 3.0 | 6.4 | 0/1 | 0ms |
| #90 | Gemini 3.1 Flash Lite none | 4.0 | 6.4 | 0/1 | 992ms | |
| #92 | Laguna M.1 medium | Poolside | 3.0 | 6.4 | 0/1 | 0ms |
| #93 | Qwen3.6 Plus Preview medium | Qwen | 3.0 | 6.3 | 0/1 | 0ms |
| #94 | GPT-5 Nano medium | OpenAI | 4.1 | 6.3 | 0/1 | 17.5s |
| #95 | Qwen3.5 Plus 2026-02-15 none | Qwen | 4.4 | 6.3 | 0/1 | 2.26s |