AI BENCHY श्रेणी
पहेली समाधान रैंकिंग
देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.
| रैंक | मॉडल | कंपनी | पहेली समाधान स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #67 | Qwen3.5-27B none | Qwen | 6.7 | 5.9 | 1/3 | 1.37s |
| #70 | Qwen3.5-122B-A10B none | Qwen | 5.4 | 5.7 | 1/3 | 982ms |
| #71 | MiniMax M2.5 medium | Minimax | 5.3 | 5.7 | 1/3 | 11.5s |
| #72 | Hunter Alpha none | OpenRouter | 5.8 | 5.7 | 1/3 | 3.06s |
| #75 | GLM 5.1 none | Z.ai | 5.7 | 5.6 | 1/3 | 1.48s |
| #77 | GLM 5 Turbo none | Z.ai | 5.5 | 5.5 | 1/3 | 2.43s |
| #78 | Trinity Large Preview none | Arcee AI | 5.4 | 5.3 | 1/3 | 3.30s |
| #79 | Grok 4.20 Beta none | X AI | 5.9 | 5.3 | 1/3 | 541ms |
| #82 | Grok 4.20 none | X AI | 5.3 | 5.2 | 1/3 | 487ms |
| #86 | GPT-5.4 Mini none | OpenAI | 5.4 | 5.1 | 1/3 | 860ms |
| #88 | Nemotron 3 Super none | NVIDIA | 5.7 | 5.1 | 1/3 | 7.50s |
| #34 | Kimi K2.6 medium | Moonshot AI | 5.0 | 7.7 | 0/3 | 25.6s |
| #38 | GPT-5.4 Nano medium | OpenAI | 4.0 | 7.6 | 0/3 | 3.65s |
| #51 | Nemotron 3 Super medium | NVIDIA | 3.5 | 6.7 | 0/3 | 8.39s |
| #54 | Mercury 2 medium | Inception | 3.9 | 6.5 | 0/3 | 934ms |