AI BENCHY زمرہ
پہیلی حل کرنا درجہ بندی
دیکھیں کہ پہیلی حل کرنا میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.
| درجہ | ماڈل | کمپنی | پہیلی حل کرنا اسکور | اسکور | درست ٹیسٹس | ردِعمل کا وقت (اوسط) |
|---|---|---|---|---|---|---|
| #42 | Claude Sonnet 4.6 none | Anthropic | 7.7 | 7.4 | 2/3 | 2.92s |
| #49 | Qwen3.5 Plus 2026-02-15 none | Qwen | 7.7 | 6.8 | 2/3 | 2.82s |
| #22 | Gemini 3.1 Flash Lite Preview low | 10.0 | 8.1 | 3/3 | 2.76s | |
| #55 | MiMo-V2-Omni none | Xiaomi | 8.0 | 6.5 | 2/3 | 2.71s |
| #4 | Claude Opus 4.7 none | Anthropic | 10.0 | 9.2 | 3/3 | 2.58s |
| #3 | Claude Opus 4.7 medium | Anthropic | 10.0 | 9.2 | 3/3 | 2.51s |
| #61 | Seed-2.0-Lite none | Bytedance Seed | 5.2 | 6.2 | 1/3 | 2.46s |
| #77 | GLM 5 Turbo none | Z.ai | 5.5 | 5.5 | 1/3 | 2.43s |
| #92 | Qwen3 Coder Next medium | Qwen | 3.1 | 4.7 | 0/3 | 2.30s |
| #58 | GLM 5V Turbo none | Z.ai | 5.3 | 6.2 | 1/3 | 2.22s |
| #53 | GLM 5 none | Z.ai | 7.7 | 6.6 | 2/3 | 2.05s |
| #73 | Mistral Small 4 medium | Mistral | 3.4 | 5.7 | 0/3 | 2.00s |
| #65 | MiMo-V2-Pro none | Xiaomi | 6.0 | 6.0 | 1/3 | 1.83s |
| #98 | LFM2-24B-A2B none | Liquid | 4.4 | 4.1 | 0/3 | 1.69s |
| #69 | Kimi K2.6 none | Moonshot AI | 3.4 | 5.8 | 0/3 | 1.66s |