AI BENCHY श्रेणी
पहेली समाधान रैंकिंग
देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.
| रैंक | मॉडल | कंपनी | पहेली समाधान स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #70 | GPT-5.4 Nano medium | OpenAI | 4.1 | 7.0 | 0/3 | 3.79s |
| #64 | MiMo-V2-Flash medium | Xiaomi | 7.7 | 7.2 | 2/3 | 3.87s |
| #35 | Gemini 3 PRO Preview medium | 10.0 | 7.6 | 3/3 | 3.88s | |
| #10 | Claude Opus 4.8 medium | Anthropic | 10.0 | 8.7 | 3/3 | 3.95s |
| #135 | Kimi K2.5 none | Moonshot AI | 3.0 | 5.2 | 0/3 | 4.04s |
| #1 | Gemini 3 Flash Preview medium | 10.0 | 9.8 | 3/3 | 4.05s | |
| #24 | GPT-5.2 Chat none | OpenAI | 7.7 | 7.9 | 2/3 | 4.10s |
| #121 | Owl Alpha none | Openrouter | 5.4 | 5.5 | 1/3 | 4.18s |
| #85 | Gemma 4 31B none | 6.5 | 6.5 | 1/3 | 4.23s | |
| #45 | GPT-5.4 Mini medium | OpenAI | 7.8 | 7.5 | 2/3 | 4.37s |
| #156 | Hy3 preview none | Tencent | 3.1 | 4.4 | 0/3 | 4.56s |
| #69 | Claude Opus 4.6 medium | Anthropic | 7.7 | 7.0 | 2/3 | 4.71s |
| #6 | GPT-5.5 low | OpenAI | 10.0 | 9.0 | 3/3 | 4.74s |
| #15 | GPT-5.3-Codex medium | OpenAI | 9.0 | 8.4 | 2/3 | 5.05s |
| #51 | Mimo V2 PRO medium | Xiaomi | 6.4 | 7.4 | 1/3 | 5.08s |