Рейтинг моделей по Эрудиция

Категория AI BENCHY

Посмотрите, какие AI-модели лучше всего справляются с Эрудиция, какие остаются надежными и где заметнее всего разница. Сортировать по: Общая стоимость ↓.

Показано моделей

Среднее значение Оценка Эрудиция

3.1

Лучшая модель

Grok 4.20 Multi Agent Beta 0.0

Причины сбоев

С причиной сбоя Неверный ответ133 С причиной сбоя Ошибка API13 С причиной сбоя Нет ответа8

169/169

Ранг	Модель	Компания	Оценка Эрудиция	Оценка	Общая стоимость	Тестов верно	Время ответа (среднее)
#156	Laguna Xs.2 medium	Poolside	3.0	4.3	$0.000	0/1	0ms
Всего тестов 1 Ошибочных тестов 1 Общая стоимость $0.000 Время ответа (среднее) 0ms
#162	Laguna Xs.2 none	Poolside	3.0	4.0	$0.000	0/1	0ms
Всего тестов 1 Ошибочных тестов 1 Общая стоимость $0.000 Время ответа (среднее) 0ms
#166	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	3.0	3.6	$0.000	0/1	0ms
Всего тестов 1 Ошибочных тестов 1 Общая стоимость $0.000 Время ответа (среднее) 0ms
#167	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.0	3.5	$0.000	0/1	0ms
Всего тестов 1 Ошибочных тестов 1 Общая стоимость $0.000 Время ответа (среднее) 0ms

Рейтинг Эрудиция

Фильтровать модели

Лучшие модели по Оценка Эрудиция

Оценка Эрудиция vs общая стоимость

Лучшие модели по Время ответа (среднее)