AI BENCHY
Advertise here

Категория AI BENCHY

Рейтинг Предметно-ориентированное

Посмотрите, какие AI-модели лучше всего справляются с Предметно-ориентированное, какие остаются надежными и где заметнее всего разница. Сортировать по: Метрика ↑.

Показано моделей

15

Среднее значение Оценка Предметно-ориентированное

4.8

Лучшая модель

GLM 5 Turbo 2.9
Ранг Модель Компания Оценка Предметно-ориентированное Оценка Тестов верно Время ответа (среднее)
#131 Qwen3.5-122B-A10B none Qwen 5.3 5.3 1/3 465ms
#134 GLM 5 Turbo none Z.ai 5.3 5.2 1/3 1.97s
#135 Kimi K2.5 none Moonshot AI 5.3 5.2 1/3 4.38s
#139 DeepSeek V4 Flash none DeepSeek 5.3 5.0 1/3 19.7s
#140 Qwen3 Coder Next none Qwen 5.3 4.9 1/3 962ms
#142 Mistral Small 4 none Mistral 5.3 4.9 1/3 367ms
#146 Laguna Xs.2 none Poolside 5.3 4.8 1/3 371ms
#150 Qwen3 Coder Next medium Qwen 5.3 4.6 1/3 638ms
#151 Trinity Large Preview none Arcee AI 5.3 4.6 1/3 877ms
#67 MiniMax M3 medium Minimax 5.5 7.1 1/3 233.1s
#86 Grok 4.1 Fast medium X AI 5.8 6.5 1/3 121.8s
#5 Qwen3.7 Max medium Qwen 5.9 9.1 1/3 24.9s
#15 GPT-5.3-Codex medium OpenAI 5.9 8.4 1/3 64.3s
#19 Seed-2.0-Lite medium Bytedance Seed 5.9 8.2 1/3 88.7s
#28 Gemini 2.5 Flash medium Google 5.9 7.8 1/3 37.3s

Лучшие модели по Оценка Предметно-ориентированное

Оценка Предметно-ориентированное vs общая стоимость

Лучшие модели по Время ответа (среднее)