Рейтинг моделей по Предметно-ориентированное

Посмотрите, какие AI-модели лучше всего справляются с Предметно-ориентированное, какие остаются надежными и где заметнее всего разница. Сортировать по: Тестов верно ↑.

Показано моделей

Среднее значение Оценка Предметно-ориентированное

4.7

Лучшая модель

Grok 4.5 3.6

Причины сбоев

С причиной сбоя Неверный ответ421 С причиной сбоя Тайм-аут43 С причиной сбоя Лишнее форматирование17 С причиной сбоя Нет ответа8 С причиной сбоя Ошибка API7 С причиной сбоя Не соблюдены инструкции1

216/216

Ранг	Модель	Компания	Оценка Предметно-ориентированное	Оценка	Общая стоимость	Тестов верно	Время ответа (среднее)
#108	Laguna XS 2.1 medium	Poolside	2.9	6.5	$0.068	0/3	65.7s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.068 Время ответа (среднее) 65.7s
#109	Qwen3.5-27B none	Qwen	3.0	6.5	$0.090	0/3	540ms
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.090 Время ответа (среднее) 540ms
#114	Ring-2.6-1T medium	Inclusionai	3.5	6.3	$0.103	0/3	64.9s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.103 Время ответа (среднее) 64.9s
#117	LongCat 2.0 none	Meituan	3.0	6.3	$0.044	0/3	1.72s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.044 Время ответа (среднее) 1.72s
#122	Seed-2.0-Lite none	Bytedance Seed	3.6	6.2	$0.066	0/3	1.33s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.066 Время ответа (среднее) 1.33s
#123	GPT-5.6 Luna low	OpenAI	3.6	6.2	$0.249	0/3	10.0s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.249 Время ответа (среднее) 10.0s
#125	Qwen3.5-35B-A3B medium	Qwen	4.1	6.2	$0.837	0/3	88.3s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.837 Время ответа (среднее) 88.3s
#126	Gemini 3.1 Flash Lite minimal	Google	2.9	6.1	$0.047	0/3	1.02s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.047 Время ответа (среднее) 1.02s
#127	gpt-oss-120b medium	OpenAI	2.9	6.1	$0.019	0/3	50.9s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.019 Время ответа (среднее) 50.9s
#128	Gemini 3.1 Flash Lite none	Google	2.9	6.1	$0.046	0/3	762ms
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.046 Время ответа (среднее) 762ms
#140	Mimo V2 Omni medium	Xiaomi	3.0	5.9	$0.683	0/3	47.9s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.683 Время ответа (среднее) 47.9s
#142	GPT-5.4 Mini none	OpenAI	3.5	5.9	$0.095	0/3	937ms
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.095 Время ответа (среднее) 937ms
#146	Nemotron 3 Super medium	NVIDIA	2.9	5.7	$0.055	0/3	16.2s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.055 Время ответа (среднее) 16.2s
#147	GLM 5 none	Z.ai	3.0	5.7	$0.041	0/3	2.24s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.041 Время ответа (среднее) 2.24s
#149	Gemini 3.1 Flash Lite high	Google	3.6	5.6	$2.044	0/3	139.9s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $2.044 Время ответа (среднее) 139.9s

Рейтинг Предметно-ориентированное

Фильтровать модели

Лучшие модели по Оценка Предметно-ориентированное

Оценка Предметно-ориентированное vs общая стоимость

Лучшие модели по Время ответа (среднее)