AI BENCHY श्रेणी
Samanya Buddhimatta रैंकिंग
देखें कि Samanya Buddhimatta में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.
| रैंक | मॉडल | कंपनी | Samanya Buddhimatta स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #71 | MiniMax M2.5 medium | Minimax | 3.8 | 5.7 | 0/1 | 6.63s |
| #30 | Step 3.5 Flash medium | Stepfun | 5.5 | 7.9 | 0/1 | 6.54s |
| #50 | Hunter Alpha medium | OpenRouter | 7.0 | 6.7 | 0/1 | 6.44s |
| #56 | Grok 4.20 Multi Agent Beta medium | X AI | 5.8 | 6.4 | 0/1 | 6.40s |
| #25 | Grok 4.20 Beta medium | X AI | 10.0 | 8.0 | 1/1 | 5.78s |
| #11 | Gemini 3.1 Flash Lite Preview high | 10.0 | 8.4 | 1/1 | 5.25s | |
| #37 | Claude Opus 4.6 medium | Anthropic | 10.0 | 7.6 | 1/1 | 5.04s |
| #26 | Claude Sonnet 4.6 medium | Anthropic | 10.0 | 8.0 | 1/1 | 4.94s |
| #16 | GPT-5.4 medium | OpenAI | 4.7 | 8.2 | 0/1 | 4.92s |
| #7 | GPT-5.3-Codex medium | OpenAI | 4.6 | 8.6 | 0/1 | 4.87s |
| #15 | Gemini 2.5 Flash medium | 4.8 | 8.2 | 0/1 | 4.86s | |
| #40 | GPT-5.2 medium | OpenAI | 3.7 | 7.5 | 0/1 | 4.32s |
| #41 | MiMo-V2-Flash medium | Xiaomi | 4.0 | 7.5 | 0/1 | 4.20s |
| #38 | GPT-5.4 Nano medium | OpenAI | 4.5 | 7.6 | 0/1 | 4.15s |
| #1 | Gemini 3 Flash Preview medium | 10.0 | 10.0 | 1/1 | 4.09s |