AI BENCHY श्रेणी
पहेली समाधान रैंकिंग
देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.
| रैंक | मॉडल | कंपनी | पहेली समाधान स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #5 | Qwen3.7 Max medium | Qwen | 10.0 | 9.1 | 3/3 | 8.84s |
| #6 | GPT-5.5 low | OpenAI | 10.0 | 9.0 | 3/3 | 4.74s |
| #8 | Claude Opus 4.7 none | Anthropic | 10.0 | 8.9 | 3/3 | 2.46s |
| #9 | GPT-5.5 medium | OpenAI | 10.0 | 8.8 | 3/3 | 6.76s |
| #10 | Claude Opus 4.8 medium | Anthropic | 10.0 | 8.7 | 3/3 | 3.95s |
| #11 | Claude Opus 4.7 medium | Anthropic | 10.0 | 8.7 | 3/3 | 2.43s |
| #13 | Grok 4.20 Beta medium | X AI | 10.0 | 8.5 | 3/3 | 3.52s |
| #14 | Qwen3.6 Max Preview medium | Qwen | 10.0 | 8.5 | 3/3 | 24.3s |
| #16 | Gemini 3 Flash Preview low | 10.0 | 8.4 | 3/3 | 5.77s | |
| #17 | GLM 5 medium | Z.ai | 10.0 | 8.3 | 3/3 | 11.3s |
| #18 | Qwen3.7 Plus medium | Qwen | 10.0 | 8.2 | 3/3 | 16.4s |
| #20 | Gemini 3.5 Flash none | 10.0 | 8.1 | 3/3 | 3.13s | |
| #25 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 10.0 | 7.9 | 3/3 | 32.5s |
| #26 | Qwen3.6 Plus medium | Qwen | 10.0 | 7.9 | 3/3 | 6.34s |
| #27 | Gemma 4 31B medium | 9.9 | 7.8 | 3/3 | 26.9s |