Рейтинг моделей по Предметно-ориентированное

Посмотрите, какие AI-модели лучше всего справляются с Предметно-ориентированное, какие остаются надежными и где заметнее всего разница. Сортировать по: Метрика ↑.

Показано моделей

Среднее значение Оценка Предметно-ориентированное

4.7

Лучшая модель

GLM 5 Turbo 2.9

Причины сбоев

С причиной сбоя Неверный ответ421 С причиной сбоя Тайм-аут43 С причиной сбоя Лишнее форматирование17 С причиной сбоя Нет ответа8 С причиной сбоя Ошибка API7 С причиной сбоя Не соблюдены инструкции1

216/216

Ранг	Модель	Компания	Оценка Предметно-ориентированное	Оценка	Общая стоимость	Тестов верно	Время ответа (среднее)
#50	DeepSeek V4 Pro high	DeepSeek	3.6	7.7	$0.200	0/3	151.5s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.200 Время ответа (среднее) 151.5s
#87	GPT-5.6 Sol none	OpenAI	3.6	6.9	$0.524	0/3	1.43s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.524 Время ответа (среднее) 1.43s
#95	Gemini 3.5 Flash-Lite low	Google	3.6	6.7	$0.145	0/3	3.63s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.145 Время ответа (среднее) 3.63s
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	3.6	6.7	$0.476	0/3	21.6s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.476 Время ответа (среднее) 21.6s
#102	LongCat 2.0 high	Meituan	3.6	6.6	$0.469	0/3	400.3s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.469 Время ответа (среднее) 400.3s
#122	Seed-2.0-Lite none	Bytedance Seed	3.6	6.2	$0.066	0/3	1.33s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.066 Время ответа (среднее) 1.33s
#123	GPT-5.6 Luna low	OpenAI	3.6	6.2	$0.249	0/3	10.0s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.249 Время ответа (среднее) 10.0s
#149	Gemini 3.1 Flash Lite high	Google	3.6	5.6	$2.044	0/3	139.9s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $2.044 Время ответа (среднее) 139.9s
#162	Gemma 4 26B A4B none	Google	3.6	5.5	$0.015	0/3	2.49s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.015 Время ответа (среднее) 2.49s
#183	Nemotron 3 Super none	NVIDIA	3.6	4.9	$0.008	0/3	6.23s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.008 Время ответа (среднее) 6.23s
#198	Laguna M.1 none	Poolside	3.6	4.4	$0.009	0/3	5.50s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.009 Время ответа (среднее) 5.50s
#205	Hy3 preview none	Tencent	3.6	4.0	$0.003	0/3	17.6s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.003 Время ответа (среднее) 17.6s
#208	Grok Build 0.1 none	X AI	3.6	4.0	$0.547	0/3	103.7s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.547 Время ответа (среднее) 103.7s
#210	Qwen3.5-9B medium	Qwen	3.6	3.8	$0.036	0/3	137.7s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.036 Время ответа (среднее) 137.7s
#214	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.6	3.2	$0.000	0/3	489ms
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.000 Время ответа (среднее) 489ms

Рейтинг Предметно-ориентированное

Фильтровать модели

Лучшие модели по Оценка Предметно-ориентированное

Оценка Предметно-ориентированное vs общая стоимость

Лучшие модели по Время ответа (среднее)