Рейтинг моделей по Предметно-ориентированное

Посмотрите, какие AI-модели лучше всего справляются с Предметно-ориентированное, какие остаются надежными и где заметнее всего разница. Сортировать по: Время ответа (среднее) ↓.

Показано моделей

Среднее значение Оценка Предметно-ориентированное

4.7

Лучшая модель

Kimi K3 5.9

Причины сбоев

С причиной сбоя Неверный ответ412 С причиной сбоя Тайм-аут43 С причиной сбоя Лишнее форматирование17 С причиной сбоя Нет ответа8 С причиной сбоя Ошибка API7 С причиной сбоя Не соблюдены инструкции1

210/210

Ранг	Модель	Компания	Оценка Предметно-ориентированное	Оценка	Общая стоимость	Тестов верно	Время ответа (среднее)
#48	Grok Build 0.1 medium	X AI	5.3	7.6	$1.097	1/3	158.0s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $1.097 Время ответа (среднее) 158.0s
#46	DeepSeek V4 Pro high	DeepSeek	3.6	7.7	$0.200	0/3	151.5s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.200 Время ответа (среднее) 151.5s
#86	Step 3.7 Flash high	Stepfun	4.1	6.9	$1.207	0/3	149.6s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $1.207 Время ответа (среднее) 149.6s
#114	Qwen3.5-Flash medium	Qwen	5.3	6.2	$0.139	1/3	146.5s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.139 Время ответа (среднее) 146.5s
#143	Gemini 3.1 Flash Lite high	Google	3.6	5.6	$2.044	0/3	139.9s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $2.044 Время ответа (среднее) 139.9s
#204	Qwen3.5-9B medium	Qwen	3.6	3.8	$0.036	0/3	137.7s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.036 Время ответа (среднее) 137.7s
#77	Kimi K2.5 medium	Moonshot AI	3.5	7.0	$0.600	0/3	137.3s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.600 Время ответа (среднее) 137.3s
#188	Cobuddy medium	Baidu	2.9	4.7	$0.000	0/3	128.2s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.000 Время ответа (среднее) 128.2s
#163	Gemini 3.1 Flash Lite Preview high	Google	5.3	5.3	$2.310	1/3	127.6s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $2.310 Время ответа (среднее) 127.6s
#185	Grok 4.1 Fast medium	X AI	5.8	4.7	$0.069	1/3	121.8s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.069 Время ответа (среднее) 121.8s
#135	Hy3 preview high	Tencent	5.3	5.9	$0.048	1/3	109.0s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.048 Время ответа (среднее) 109.0s
#202	Grok Build 0.1 none	X AI	3.6	4.0	$0.547	0/3	103.7s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.547 Время ответа (среднее) 103.7s
#45	DeepSeek V4 Flash high	DeepSeek	4.1	7.7	$0.042	0/3	100.3s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.042 Время ответа (среднее) 100.3s
#113	MiMo-V2-Flash medium	Xiaomi	5.9	6.3	$0.043	1/3	96.0s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.043 Время ответа (среднее) 96.0s
#19	Qwen3.6 Max Preview medium	Qwen	2.9	8.4	$1.143	0/3	95.9s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $1.143 Время ответа (среднее) 95.9s

Рейтинг Предметно-ориентированное

Фильтровать модели

Лучшие модели по Оценка Предметно-ориентированное

Оценка Предметно-ориентированное vs общая стоимость

Лучшие модели по Время ответа (среднее)