AI BENCHY श्रेणी
पहेली समाधान रैंकिंग
देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।
| रैंक | मॉडल | कंपनी | पहेली समाधान स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #1 | Gemini 3 Flash Preview medium | 10.0 | 9.8 | 3/3 | 4.05s | |
| #2 | Gemini 3.5 Flash high | 10.0 | 9.6 | 3/3 | 3.23s | |
| #3 | Gemini 3.5 Flash low | 10.0 | 9.4 | 3/3 | 2.35s | |
| #4 | Gemini 3.1 Pro Preview medium | 10.0 | 9.4 | 3/3 | 6.90s | |
| #5 | Qwen3.7 Max medium | Qwen | 10.0 | 9.1 | 3/3 | 8.84s |
| #6 | GPT-5.5 low | OpenAI | 10.0 | 9.0 | 3/3 | 4.74s |
| #8 | Claude Opus 4.7 none | Anthropic | 10.0 | 8.9 | 3/3 | 2.46s |
| #9 | GPT-5.5 medium | OpenAI | 10.0 | 8.8 | 3/3 | 6.76s |
| #10 | Claude Opus 4.8 medium | Anthropic | 10.0 | 8.7 | 3/3 | 3.95s |
| #11 | Claude Opus 4.7 medium | Anthropic | 10.0 | 8.7 | 3/3 | 2.43s |
| #13 | Grok 4.20 Beta medium | X AI | 10.0 | 8.5 | 3/3 | 3.52s |
| #14 | Qwen3.6 Max Preview medium | Qwen | 10.0 | 8.5 | 3/3 | 24.3s |
| #16 | Gemini 3 Flash Preview low | 10.0 | 8.4 | 3/3 | 5.77s | |
| #17 | GLM 5 medium | Z.ai | 10.0 | 8.3 | 3/3 | 11.3s |
| #18 | Qwen3.7 Plus medium | Qwen | 10.0 | 8.2 | 3/3 | 16.4s |