Рейтинг моделей по Эрудиция

Категория AI BENCHY

Посмотрите, какие AI-модели лучше всего справляются с Эрудиция, какие остаются надежными и где заметнее всего разница. Сортировать по: Общая стоимость ↑.

Показано моделей

Среднее значение Оценка Эрудиция

3.1

Лучшая модель

North Mini Code 3.0

Причины сбоев

С причиной сбоя Неверный ответ133 С причиной сбоя Ошибка API13 С причиной сбоя Нет ответа8

169/169

Ранг	Модель	Компания	Оценка Эрудиция	Оценка	Общая стоимость	Тестов верно	Время ответа (среднее)
#95	Gemini 3.1 Flash Lite Preview high	Google	0.0	6.1	$2.310	0/0	0ms
Всего тестов 0 Ошибочных тестов 0 Общая стоимость $2.310 Время ответа (среднее) 0ms
#6	Claude Fable 5 medium	Anthropic	3.0	9.2	$3.165	0/1	25.6s
Всего тестов 1 Ошибочных тестов 1 Общая стоимость $3.165 Время ответа (среднее) 25.6s
#9	GPT-5.5 medium	OpenAI	2.8	9.0	$3.679	0/1	37.9s
Всего тестов 1 Ошибочных тестов 1 Общая стоимость $3.679 Время ответа (среднее) 37.9s
#136	Grok 4.20 Multi Agent Beta medium	X AI	0.0	5.0	$5.599	0/0	0ms
Всего тестов 0 Ошибочных тестов 0 Общая стоимость $5.599 Время ответа (среднее) 0ms

Рейтинг Эрудиция

Фильтровать модели

Лучшие модели по Оценка Эрудиция

Оценка Эрудиция vs общая стоимость

Лучшие модели по Время ответа (среднее)