AI BENCHY श्रेणी
Samanya Buddhimatta रैंकिंग
देखें कि Samanya Buddhimatta में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.
| रैंक | मॉडल | कंपनी | Samanya Buddhimatta स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #45 | GPT-5.4 Mini medium | OpenAI | 4.5 | 7.5 | 0/1 | 3.72s |
| #46 | Qwen3.6 35B A3B medium | Qwen | 4.4 | 7.4 | 0/1 | 8.66s |
| #47 | Grok Build 0.1 medium | X AI | 4.4 | 7.4 | 0/1 | 18.4s |
| #49 | Qwen3.5-Flash medium | Qwen | 6.1 | 7.4 | 0/1 | 40.1s |
| #50 | Gemini 3.1 Flash Lite Preview low | 4.0 | 7.4 | 0/1 | 1.54s | |
| #53 | Gemini 3.1 Flash Lite high | 5.0 | 7.3 | 0/1 | 45.7s | |
| #54 | GPT-5 Mini medium | OpenAI | 4.5 | 7.3 | 0/1 | 13.5s |
| #56 | MiMo-V2.5 medium | Xiaomi | 5.4 | 7.3 | 0/1 | 5.37s |
| #57 | Step 3.7 Flash low | Stepfun | 3.4 | 7.3 | 0/1 | 7.00s |
| #58 | Gemini 3.1 Flash Lite Preview none | 4.0 | 7.2 | 0/1 | 741ms | |
| #61 | Gemini 3.1 Flash Lite low | 4.0 | 7.2 | 0/1 | 1.37s | |
| #62 | Step 3.5 Flash medium | Stepfun | 5.5 | 7.2 | 0/1 | 22.4s |
| #63 | GPT-5.3 Chat none | OpenAI | 4.6 | 7.2 | 0/1 | 1.99s |
| #64 | MiMo-V2-Flash medium | Xiaomi | 4.0 | 7.2 | 0/1 | 4.20s |
| #65 | Grok 4.20 medium | X AI | 3.9 | 7.1 | 0/1 | 24.5s |