AI BENCHY
Advertise here

Категория AI BENCHY

Рейтинг Решение головоломок

Посмотрите, какие AI-модели лучше всего справляются с Решение головоломок, какие остаются надежными и где заметнее всего разница. Сортировать по: Время ответа (среднее) ↑.

Показано моделей

15

Среднее значение Оценка Решение головоломок

6.7

Лучшая модель

Mistral Small 4 3.1
Ранг Модель Компания Оценка Решение головоломок Оценка Тестов верно Время ответа (среднее)
#118 Qwen3.6 27B none Qwen 5.3 5.6 1/3 5.15s
#84 Grok 4.20 Multi Agent Beta medium X AI 6.7 6.6 1/3 5.19s
#23 GLM 5 Turbo medium Z.ai 8.7 8.0 2/3 5.23s
#40 Gemini 3.1 Flash Lite Preview medium Google 7.7 7.5 2/3 5.30s
#52 Claude Sonnet 4.6 medium Anthropic 10.0 7.4 3/3 5.31s
#43 MiMo-V2.5-Pro medium Xiaomi 6.7 7.5 1/3 5.31s
#79 Hunter Alpha medium OpenRouter 6.1 6.7 1/3 5.35s
#159 Ling-2.6-1T none Inclusionai 3.1 4.3 0/3 5.36s
#16 Gemini 3 Flash Preview low Google 10.0 8.4 3/3 5.77s
#37 Gemma 4 26B A4B medium Google 10.0 7.6 3/3 5.79s
#42 GPT-5.2 medium OpenAI 7.5 7.5 2/3 5.80s
#46 Qwen3.6 35B A3B medium Qwen 8.0 7.4 2/3 5.95s
#22 Step 3.7 Flash medium Stepfun 5.7 8.0 1/3 6.19s
#65 Grok 4.20 medium X AI 7.7 7.1 2/3 6.22s
#39 Qwen3.6 Flash medium Qwen 8.2 7.5 2/3 6.29s

Лучшие модели по Оценка Решение головоломок

Оценка Решение головоломок vs общая стоимость

Лучшие модели по Время ответа (среднее)