Рейтинг моделей по Общий интеллект

Посмотрите, какие AI-модели лучше всего справляются с Общий интеллект, какие остаются надежными и где заметнее всего разница.

Показано моделей

Среднее значение Оценка Общий интеллект

6.1

Лучшая модель

Gemini 3 Flash Preview 10.0

Причины сбоев

С причиной сбоя Не соблюдены инструкции78 С причиной сбоя Неверный ответ59 С причиной сбоя Ошибка API12 С причиной сбоя Тайм-аут4

210/210

Ранг	Модель	Компания	Оценка Общий интеллект	Оценка	Общая стоимость	Тестов верно	Время ответа (среднее)
#110	Gemma 4 31B medium	Google	10.0	6.3	$0.163	1/1	9.57s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.163 Время ответа (среднее) 9.57s
#115	Gemma 4 31B none	Google	10.0	6.2	$0.035	1/1	2.09s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.035 Время ответа (среднее) 2.09s
#116	Seed-2.0-Lite none	Bytedance Seed	10.0	6.2	$0.066	1/1	3.45s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.066 Время ответа (среднее) 3.45s
#123	Inkling low	Thinkingmachines	10.0	6.1	$0.187	1/1	3.44s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.187 Время ответа (среднее) 3.44s
#124	Qwen3.6 Flash none	Qwen	10.0	6.1	$0.062	1/1	947ms
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.062 Время ответа (среднее) 947ms
#125	Qwen3.5-Flash none	Qwen	10.0	6.1	$0.073	1/1	803ms
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.073 Время ответа (среднее) 803ms
#131	Grok 4.20 Beta medium	X AI	10.0	6.0	$0.750	1/1	5.78s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.750 Время ответа (среднее) 5.78s
#133	Gemini 3 PRO Preview medium	Google	10.0	6.0	$0.385	1/1	9.34s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.385 Время ответа (среднее) 9.34s
#141	GLM 5 none	Z.ai	10.0	5.7	$0.041	1/1	3.27s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.041 Время ответа (среднее) 3.27s
#155	Kimi K2.5 none	Moonshot AI	10.0	5.5	$0.127	1/1	4.00s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.127 Время ответа (среднее) 4.00s
#163	Gemini 3.1 Flash Lite Preview high	Google	10.0	5.3	$2.310	1/1	5.25s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $2.310 Время ответа (среднее) 5.25s
#166	Qwen3 Coder Next none	Qwen	10.0	5.1	$0.025	1/1	1.34s
Всего тестов 1 Ошибочных тестов 0 Общая стоимость $0.025 Время ответа (среднее) 1.34s
#184	Hunter Alpha medium	OpenRouter	7.0	4.7	$0.000	0/1	6.44s
Всего тестов 1 Ошибочных тестов 1 Общая стоимость $0.000 Время ответа (среднее) 6.44s
#35	Seed-2.0-Lite medium	Bytedance Seed	6.7	7.9	$0.234	0/1	18.2s
Всего тестов 1 Ошибочных тестов 1 Общая стоимость $0.234 Время ответа (среднее) 18.2s
#22	Grok 4.5 medium	X AI	6.5	8.3	$1.928	0/1	12.8s
Всего тестов 1 Ошибочных тестов 1 Общая стоимость $1.928 Время ответа (среднее) 12.8s

Рейтинг Общий интеллект

Фильтровать модели

Лучшие модели по Оценка Общий интеллект

Оценка Общий интеллект vs общая стоимость

Лучшие модели по Время ответа (среднее)