AI BENCHY
Your ad here

Категория AI BENCHY

Рейтинг Предметно-ориентированное

Посмотрите, какие AI-модели лучше всего справляются с Предметно-ориентированное, какие остаются надежными и где заметнее всего разница. Сортировать по: Тестов верно ↑.

Показано моделей

15

Среднее значение Оценка Предметно-ориентированное

4.8

Лучшая модель

Qwen3.6 Plus Preview 3.0
Ранг Модель Компания Оценка Предметно-ориентированное Оценка Тестов верно Время ответа (среднее)
#46 Kimi K2.5 medium Moonshot AI 3.5 7.0 0/3 137.3s
#50 Hunter Alpha medium OpenRouter 3.0 6.7 0/3 10.5s
#51 Nemotron 3 Super medium NVIDIA 2.9 6.7 0/3 16.2s
#53 GLM 5 none Z.ai 3.0 6.6 0/3 2.24s
#54 Mercury 2 medium Inception 2.9 6.5 0/3 6.48s
#56 Grok 4.20 Multi Agent Beta medium X AI 2.9 6.4 0/3 24.7s
#60 Gemma 4 26B A4B none Google 3.6 6.2 0/3 2.49s
#61 Seed-2.0-Lite none Bytedance Seed 3.6 6.2 0/3 1.33s
#64 DeepSeek V3.2 none DeepSeek 3.6 6.1 0/3 1.61s
#67 Qwen3.5-27B none Qwen 3.0 5.9 0/3 540ms
#68 gpt-oss-120b medium OpenAI 2.9 5.8 0/3 50.9s
#71 MiniMax M2.5 medium Minimax 2.9 5.7 0/3 237.3s
#75 GLM 5.1 none Z.ai 2.9 5.6 0/3 1.99s
#79 Grok 4.20 Beta none X AI 3.0 5.3 0/3 611ms
#80 MiniMax M2.7 medium Minimax 3.0 5.3 0/3 19.0s

Лучшие модели по Оценка Предметно-ориентированное

Оценка Предметно-ориентированное vs общая стоимость

Лучшие модели по Время ответа (среднее)