Рейтинг моделей по Решение головоломок

Посмотрите, какие AI-модели лучше всего справляются с Решение головоломок, какие остаются надежными и где заметнее всего разница. Сортировать по: Тестов верно ↑.

Показано моделей

Среднее значение Оценка Решение головоломок

6.7

Лучшая модель

GPT-5.4 Nano 4.1

Причины сбоев

С причиной сбоя Неверный ответ204 С причиной сбоя Не соблюдены инструкции90 С причиной сбоя Ошибка API12 С причиной сбоя Лишнее форматирование8 С причиной сбоя Тайм-аут5 С причиной сбоя Нет ответа3

216/216

Ранг	Модель	Компания	Оценка Решение головоломок	Оценка	Общая стоимость	Тестов верно	Время ответа (среднее)
#108	Laguna XS 2.1 medium	Poolside	5.3	6.5	$0.068	1/3	3.43s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.068 Время ответа (среднее) 3.43s
#109	Qwen3.5-27B none	Qwen	6.7	6.5	$0.090	1/3	1.38s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.090 Время ответа (среднее) 1.38s
#114	Ring-2.6-1T medium	Inclusionai	5.9	6.3	$0.103	1/3	20.7s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.103 Время ответа (среднее) 20.7s
#115	Mimo V2 PRO medium	Xiaomi	6.4	6.3	$0.333	1/3	5.08s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.333 Время ответа (среднее) 5.08s
#118	Claude Sonnet 5 none	Anthropic	6.0	6.3	$0.548	1/3	3.22s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.548 Время ответа (среднее) 3.22s
#121	Gemma 4 31B none	Google	6.5	6.2	$0.021	1/3	4.23s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.021 Время ответа (среднее) 4.23s
#122	Seed-2.0-Lite none	Bytedance Seed	5.3	6.2	$0.066	1/3	2.78s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.066 Время ответа (среднее) 2.78s
#126	Gemini 3.1 Flash Lite minimal	Google	6.0	6.1	$0.047	1/3	2.15s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.047 Время ответа (среднее) 2.15s
#127	gpt-oss-120b medium	OpenAI	5.3	6.1	$0.019	1/3	21.7s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.019 Время ответа (среднее) 21.7s
#128	Gemini 3.1 Flash Lite none	Google	6.3	6.1	$0.046	1/3	720ms
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.046 Время ответа (среднее) 720ms
#129	Inkling low	Thinkingmachines	6.4	6.1	$0.187	1/3	2.97s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.187 Время ответа (среднее) 2.97s
#132	Qwen3.5 Plus 2026-04-20 none	Qwen	6.7	6.1	$0.122	1/3	1.97s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.122 Время ответа (среднее) 1.97s
#134	GPT-5 Nano medium	OpenAI	5.3	6.1	$0.114	1/3	20.6s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.114 Время ответа (среднее) 20.6s
#135	Nemotron 3 Ultra none	NVIDIA	5.9	6.1	$0.095	1/3	1.06s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.095 Время ответа (среднее) 1.06s
#136	Step 3.5 Flash medium	Stepfun	5.3	6.0	$0.108	1/3	7.22s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.108 Время ответа (среднее) 7.22s

Рейтинг Решение головоломок

Фильтровать модели

Лучшие модели по Оценка Решение головоломок

Оценка Решение головоломок vs общая стоимость

Лучшие модели по Время ответа (среднее)