AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Категория AI BENCHY

Рейтинг Предметно-ориентированное

Посмотрите, какие AI-модели лучше всего справляются с Предметно-ориентированное, какие остаются надежными и где заметнее всего разница. Сортировать по: Тестов верно ↑.

Показано моделей

15

Среднее значение Оценка Предметно-ориентированное

4.8

Лучшая модель

Qwen3.6 Plus Preview 3.0
Ранг Модель Компания Оценка Предметно-ориентированное Оценка Тестов верно Время ответа (среднее)
#81 Elephant medium Openrouter 3.0 5.2 0/3 925ms
#82 Grok 4.20 none X AI 3.0 5.2 0/3 687ms
#84 gpt-oss-120b none OpenAI 3.0 5.2 0/3 35.0s
#85 Elephant none Openrouter 3.0 5.2 0/3 927ms
#86 GPT-5.4 Mini none OpenAI 3.5 5.1 0/3 937ms
#88 Nemotron 3 Super none NVIDIA 3.6 5.1 0/3 6.23s
#89 GPT-4o-mini none OpenAI 3.0 4.9 0/3 637ms
#90 Qwen3.5-9B none Qwen 3.0 4.8 0/3 464ms
#93 GLM 4.7 Flash medium Z.ai 3.5 4.6 0/3 174.6s
#96 GPT-5.4 Nano none OpenAI 2.9 4.5 0/3 926ms
#97 Qwen3.5-9B medium Qwen 3.6 4.4 0/3 137.7s
#5 Gemini 3 Flash Preview low Google 5.3 8.8 1/3 8.05s
#6 Seed-2.0-Lite medium Bytedance Seed 5.9 8.6 1/3 88.7s
#7 GPT-5.3-Codex medium OpenAI 5.9 8.6 1/3 64.3s
#8 Qwen3.5 Plus 2026-02-15 medium Qwen 5.3 8.5 1/3 17.5s

Лучшие модели по Оценка Предметно-ориентированное

Оценка Предметно-ориентированное vs общая стоимость

Лучшие модели по Время ответа (среднее)