AI BENCHY श्रेणी
Samanya Buddhimatta रैंकिंग
देखें कि Samanya Buddhimatta में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: मेट्रिक ↑.
| रैंक | मॉडल | कंपनी | Samanya Buddhimatta स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #82 | Grok 4.20 none | X AI | 4.8 | 5.2 | 0/1 | 659ms |
| #86 | GPT-5.4 Mini none | OpenAI | 4.8 | 5.1 | 0/1 | 1.82s |
| #91 | Mercury 2 none | Inception | 4.8 | 4.8 | 0/1 | 628ms |
| #62 | Gemini 2.5 Flash none | 5.0 | 6.2 | 0/1 | 615ms | |
| #67 | Qwen3.5-27B none | Qwen | 5.0 | 5.9 | 0/1 | 2.51s |
| #70 | Qwen3.5-122B-A10B none | Qwen | 5.0 | 5.7 | 0/1 | 1.12s |
| #75 | GLM 5.1 none | Z.ai | 5.0 | 5.6 | 0/1 | 790ms |
| #79 | Grok 4.20 Beta none | X AI | 5.0 | 5.3 | 0/1 | 541ms |
| #9 | Qwen3.6 Plus Preview medium | Qwen | 5.1 | 8.5 | 0/1 | 27.1s |
| #20 | Qwen3.6 Plus medium | Qwen | 5.1 | 8.1 | 0/1 | 27.1s |
| #39 | Seed-2.0-Mini medium | Bytedance Seed | 5.1 | 7.5 | 0/1 | 36.7s |
| #69 | Kimi K2.6 none | Moonshot AI | 5.4 | 5.8 | 0/1 | 1.55s |
| #27 | DeepSeek V3.2 medium | DeepSeek | 5.4 | 8.0 | 0/1 | 31.3s |
| #30 | Step 3.5 Flash medium | Stepfun | 5.5 | 7.9 | 0/1 | 6.54s |
| #47 | Grok 4.20 medium | X AI | 5.8 | 7.0 | 0/1 | 7.09s |