AI BENCHY
Your ad here

AI BENCHY श्रेणी

पहेली समाधान रैंकिंग

देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

15

औसत पहेली समाधान स्कोर

6.4

सर्वश्रेष्ठ मॉडल

Grok 4.20 5.3
रैंक मॉडल कंपनी पहेली समाधान स्कोर स्कोर सही परीक्षण प्रतिक्रिया समय (औसत)
#77 GLM 5 Turbo none Z.ai 5.5 5.5 1/3 2.43s
#61 Seed-2.0-Lite none Bytedance Seed 5.2 6.2 1/3 2.46s
#3 Claude Opus 4.7 medium Anthropic 10.0 9.2 3/3 2.51s
#4 Claude Opus 4.7 none Anthropic 10.0 9.2 3/3 2.58s
#55 MiMo-V2-Omni none Xiaomi 8.0 6.5 2/3 2.71s
#22 Gemini 3.1 Flash Lite Preview low Google 10.0 8.1 3/3 2.76s
#49 Qwen3.5 Plus 2026-02-15 none Qwen 7.7 6.8 2/3 2.82s
#42 Claude Sonnet 4.6 none Anthropic 7.7 7.4 2/3 2.92s
#36 GPT-5.3 Chat none OpenAI 10.0 7.7 3/3 2.93s
#48 Gemma 4 31B none Google 5.5 6.9 1/3 2.95s
#72 Hunter Alpha none OpenRouter 5.8 5.7 1/3 3.06s
#78 Trinity Large Preview none Arcee AI 5.4 5.3 1/3 3.30s
#17 Gemini 3.1 Flash Lite Preview medium Google 7.7 8.2 2/3 3.58s
#38 GPT-5.4 Nano medium OpenAI 4.0 7.6 0/3 3.65s
#41 MiMo-V2-Flash medium Xiaomi 7.7 7.5 2/3 3.77s

पहेली समाधान स्कोर के अनुसार शीर्ष मॉडल

पहेली समाधान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल