Рейтинг моделей по Предметно-ориентированное

Посмотрите, какие AI-модели лучше всего справляются с Предметно-ориентированное, какие остаются надежными и где заметнее всего разница. Сортировать по: Тестов верно ↓.

Показано моделей

Среднее значение Оценка Предметно-ориентированное

4.7

Лучшая модель

Gemini 3.6 Flash 10.0

Причины сбоев

С причиной сбоя Неверный ответ421 С причиной сбоя Тайм-аут43 С причиной сбоя Лишнее форматирование17 С причиной сбоя Нет ответа8 С причиной сбоя Ошибка API7 С причиной сбоя Не соблюдены инструкции1

216/216

Ранг	Модель	Компания	Оценка Предметно-ориентированное	Оценка	Общая стоимость	Тестов верно	Время ответа (среднее)
#19	Muse Spark 1.1 medium	Meta	3.5	8.6	$1.357	0/3	71.4s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $1.357 Время ответа (среднее) 71.4s
#22	Qwen3.6 Max Preview medium	Qwen	2.9	8.4	$1.143	0/3	95.9s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $1.143 Время ответа (среднее) 95.9s
#23	Grok 4.5 low	X AI	3.0	8.4	$0.935	0/3	72.6s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.935 Время ответа (среднее) 72.6s
#25	Grok 4.5 medium	X AI	2.9	8.3	$1.928	0/3	198.9s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $1.928 Время ответа (среднее) 198.9s
#27	Muse Spark 1.1 low	Meta	2.9	8.3	$0.647	0/3	29.7s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.647 Время ответа (среднее) 29.7s
#29	GPT-5 Mini medium	OpenAI	3.6	8.1	$0.237	0/3	44.6s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.237 Время ответа (среднее) 44.6s
#30	Muse Spark 1.1 high	Meta	3.5	8.1	$1.694	0/3	67.4s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $1.694 Время ответа (среднее) 67.4s
#35	GLM 5.2 high	Z.ai	3.7	8.0	$0.817	0/3	74.0s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.817 Время ответа (среднее) 74.0s
#40	Qwen3.7 Plus medium	Qwen	3.6	7.9	$0.267	0/3	45.3s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.267 Время ответа (среднее) 45.3s
#41	Qwen3.6 Plus medium	Qwen	2.9	7.8	$0.405	0/3	29.6s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.405 Время ответа (среднее) 29.6s
#42	GLM 5.2 medium	Z.ai	4.1	7.8	$0.187	0/3	45.5s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.187 Время ответа (среднее) 45.5s
#44	Claude Sonnet 4.6 medium	Anthropic	2.9	7.8	$2.057	0/3	0ms
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $2.057 Время ответа (среднее) 0ms
#46	GLM 5 medium	Z.ai	3.5	7.7	$0.307	0/3	0ms
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.307 Время ответа (среднее) 0ms
#47	Claude Opus 4.6 medium	Anthropic	3.0	7.7	$3.059	0/3	83.4s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $3.059 Время ответа (среднее) 83.4s
#49	DeepSeek V4 Flash high	DeepSeek	4.1	7.7	$0.041	0/3	100.3s
Всего тестов 3 Ошибочных тестов 3 Общая стоимость $0.041 Время ответа (среднее) 100.3s

Рейтинг Предметно-ориентированное

Фильтровать модели

Лучшие модели по Оценка Предметно-ориентированное

Оценка Предметно-ориентированное vs общая стоимость

Лучшие модели по Время ответа (среднее)