Рейтинг моделей по Предметно-ориентированное

Посмотрите, какие AI-модели лучше всего справляются с Предметно-ориентированное, какие остаются надежными и где заметнее всего разница.

Показано моделей

Среднее значение Оценка Предметно-ориентированное

4.7

Лучшая модель

Gemini 3 Flash Preview 10.0

Причины сбоев

С причиной сбоя Неверный ответ412 С причиной сбоя Тайм-аут43 С причиной сбоя Лишнее форматирование17 С причиной сбоя Нет ответа8 С причиной сбоя Ошибка API7 С причиной сбоя Не соблюдены инструкции1

210/210

Ранг	Модель	Компания	Оценка Предметно-ориентированное	Оценка	Общая стоимость	Тестов верно	Время ответа (среднее)
#110	Gemma 4 31B medium	Google	7.7	6.3	$0.163	2/3	38.5s
Всего тестов 3 Ошибочных тестов 1 Общая стоимость $0.163 Время ответа (среднее) 38.5s
#115	Gemma 4 31B none	Google	7.7	6.2	$0.035	2/3	3.22s
Всего тестов 3 Ошибочных тестов 1 Общая стоимость $0.035 Время ответа (среднее) 3.22s
#125	Qwen3.5-Flash none	Qwen	7.7	6.1	$0.073	2/3	905ms
Всего тестов 3 Ошибочных тестов 1 Общая стоимость $0.073 Время ответа (среднее) 905ms
#127	Qwen3.5-35B-A3B none	Qwen	7.7	6.1	$0.106	2/3	485ms
Всего тестов 3 Ошибочных тестов 1 Общая стоимость $0.106 Время ответа (среднее) 485ms
#152	Qwen3.6 27B none	Qwen	7.7	5.5	$0.087	2/3	3.03s
Всего тестов 3 Ошибочных тестов 1 Общая стоимость $0.087 Время ответа (среднее) 3.03s
#176	GLM 4.7 Flash none	Z.ai	7.7	4.9	$0.016	2/3	744ms
Всего тестов 3 Ошибочных тестов 1 Общая стоимость $0.016 Время ответа (среднее) 744ms
#2	Gemini 3.5 Flash high	Google	7.6	9.5	$1.976	2/3	14.1s
Всего тестов 3 Ошибочных тестов 1 Общая стоимость $1.976 Время ответа (среднее) 14.1s
#79	Gemini 3.5 Flash none	Google	7.6	7.0	$1.079	2/3	10.6s
Всего тестов 3 Ошибочных тестов 1 Общая стоимость $1.079 Время ответа (среднее) 10.6s
#4	GPT-5.6 Sol medium	OpenAI	5.9	9.4	$1.316	1/3	47.9s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $1.316 Время ответа (среднее) 47.9s
#8	Qwen3.7 Max medium	Qwen	5.9	9.2	$1.116	1/3	24.9s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $1.116 Время ответа (среднее) 24.9s
#13	GPT-5.3-Codex medium	OpenAI	5.9	8.9	$0.920	1/3	64.3s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.920 Время ответа (среднее) 64.3s
#21	GPT-5.2 medium	OpenAI	5.9	8.4	$0.951	1/3	77.8s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.951 Время ответа (среднее) 77.8s
#25	Gemini 2.5 Flash medium	Google	5.9	8.2	$0.643	1/3	37.3s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.643 Время ответа (среднее) 37.3s
#35	Seed-2.0-Lite medium	Bytedance Seed	5.9	7.9	$0.234	1/3	88.7s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.234 Время ответа (среднее) 88.7s
#53	GPT-5.4 Nano medium	OpenAI	5.9	7.5	$0.138	1/3	38.2s
Всего тестов 3 Ошибочных тестов 2 Общая стоимость $0.138 Время ответа (среднее) 38.2s

Рейтинг Предметно-ориентированное

Фильтровать модели

Лучшие модели по Оценка Предметно-ориентированное

Оценка Предметно-ориентированное vs общая стоимость

Лучшие модели по Время ответа (среднее)