Рейтинг моделей по Предметно-ориентированное

Посмотрите, какие AI-модели лучше всего справляются с Предметно-ориентированное, какие остаются надежными и где заметнее всего разница.

Показано моделей

Среднее значение Оценка Предметно-ориентированное

4.7

Лучшая модель

Gemini 3.6 Flash 10.0

Причины сбоев

С причиной сбоя Неверный ответ421 С причиной сбоя Тайм-аут43 С причиной сбоя Лишнее форматирование17 С причиной сбоя Нет ответа8 С причиной сбоя Ошибка API7 С причиной сбоя Не соблюдены инструкции1

216/216

Ранг	Модель	Компания	Оценка Предметно-ориентированное	Оценка	Общая стоимость	Тестов верно	Время ответа (среднее)
#13	GPT-5.5 medium	OpenAI	5.3	9.0	$4.137	1/3	164.1s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $4.137 Время ответа (среднее) 164.1s
#20	Claude Fable 5 medium	Anthropic	5.3	8.6	$3.478	1/3	53.4s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $3.478 Время ответа (среднее) 53.4s
#21	GPT-5.4 medium	OpenAI	5.3	8.5	$1.533	1/3	74.3s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $1.533 Время ответа (среднее) 74.3s
#31	Gemini 3.5 Flash-Lite high	Google	5.3	8.1	$0.584	1/3	19.5s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.584 Время ответа (среднее) 19.5s
#36	Inkling medium	Thinkingmachines	5.3	8.0	$0.391	1/3	35.6s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.391 Время ответа (среднее) 35.6s
#59	GPT-5.6 Terra low	OpenAI	5.3	7.5	$0.519	1/3	8.34s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.519 Время ответа (среднее) 8.34s
#65	Gemini 3 Flash Preview low	Google	5.3	7.4	$0.177	1/3	8.05s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.177 Время ответа (среднее) 8.05s
#70	Claude Opus 4.8 none	Anthropic	5.3	7.3	$1.166	1/3	1.70s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $1.166 Время ответа (среднее) 1.70s
#71	Step 3.7 Flash low	Stepfun	5.3	7.3	$0.454	1/3	43.3s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.454 Время ответа (среднее) 43.3s
#72	Kimi K2.6 medium	Moonshot AI	5.3	7.2	$1.036	1/3	202.4s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $1.036 Время ответа (среднее) 202.4s
#77	Grok 4.3 medium	X AI	5.3	7.1	$0.779	1/3	181.7s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.779 Время ответа (среднее) 181.7s
#94	Qwen3.6 35B A3B medium	Qwen	5.3	6.7	$0.746	1/3	22.5s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.746 Время ответа (среднее) 22.5s
#98	GLM 5V Turbo medium	Z.ai	5.3	6.7	$0.457	1/3	38.1s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.457 Время ответа (среднее) 38.1s
#118	Claude Sonnet 5 none	Anthropic	5.3	6.3	$0.548	1/3	3.28s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.548 Время ответа (среднее) 3.28s
#120	Qwen3.5-Flash medium	Qwen	5.3	6.2	$0.139	1/3	146.5s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.139 Время ответа (среднее) 146.5s

Рейтинг Предметно-ориентированное

Фильтровать модели

Лучшие модели по Оценка Предметно-ориентированное

Оценка Предметно-ориентированное vs общая стоимость

Лучшие модели по Время ответа (среднее)