AI BENCHY श्रेणी
पहेली समाधान रैंकिंग
देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.
| रैंक | मॉडल | कंपनी | पहेली समाधान स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #137 | Elephant Alpha none | Openrouter | 4.2 | 5.1 | 0/3 | 807ms |
| #102 | Gemma 4 26B A4B none | 6.2 | 6.0 | 1/3 | 744ms | |
| #90 | Gemini 3.1 Flash Lite none | 6.3 | 6.4 | 1/3 | 720ms | |
| #146 | Laguna Xs.2 none | Poolside | 5.3 | 4.8 | 1/3 | 650ms |
| #154 | Qwen3.5-9B none | Qwen | 3.2 | 4.6 | 0/3 | 621ms |
| #163 | Granite 4.1 8B none | IBM Granite | 3.2 | 4.0 | 0/3 | 608ms |
| #97 | Gemini 2.5 Flash none | 7.7 | 6.2 | 2/3 | 604ms | |
| #106 | Grok 4.20 Beta none | X AI | 7.7 | 5.8 | 2/3 | 586ms |
| #155 | Mercury 2 none | Inception | 3.1 | 4.5 | 0/3 | 535ms |
| #162 | Nemotron 3 Nano Omni 30b A3b Reasoning none | NVIDIA | 3.0 | 4.1 | 0/3 | 532ms |
| #127 | Grok 4.20 none | X AI | 5.3 | 5.4 | 1/3 | 473ms |
| #142 | Mistral Small 4 none | Mistral | 3.1 | 4.9 | 0/3 | 399ms |