AI BENCHY Compare

MiniMax: MiniMax M3 vs OpenAI: GPT-5.3 Chat

Сводка

MiniMax M3 (medium) лидирует по среднему баллу: 7.6 vs 7.5. MiniMax M3 (medium) имеет более низкую стоимость benchmark: $0.131 vs $0.433. GPT-5.3 Chat быстрее: 6.34s vs 68.17s, с долей успешных попыток 65.1% vs 66.7%.

Рекомендуемая модельGPT-5.3 ChatЕго балл близок к лучшему здесь (7.5 против 7.6), и он отвечает примерно в 10.8 раза быстрее, чем MiniMax M3 (medium).

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-14

Метрика	MiniMax M3 MiniMax M3 medium Релиз: 2026-06-01	GPT-5.3 Chat GPT-5.3 Chat none Релиз: 2026-03-03

Метрика	MiniMax M3 MiniMax M3 medium Релиз: 2026-06-01	GPT-5.3 Chat GPT-5.3 Chat none Релиз: 2026-03-03
Оценка	7.6	7.5
Ранг	#54	#61
Надежность	9.6	10.0
Стабильность	7.9	8.1
Тестов верно
Доля успешных попыток	65.1%	66.7%
Нестабильные тесты	5	5
Всего запусков	63	63
Стоимость за результат	1.187	3.605
Общая стоимость	$0.131	$0.433
Цена входа	$0.300 / 1M	$1.750 / 1M
Цена выхода	$1.200 / 1M	$14.000 / 1M
Общее число входных токенов	46,546	34,209
Выходные токены	49,036	26,617
Токены рассуждений	92,543	0
Время ответа (среднее)	68.17s	6.34s
Время ответа (макс.)	431.03s	18.33s
Время ответа (суммарно)	1363.38s	133.13s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#54 MiniMax M3

medium

Стоимость: $0.012
Время: 154.4s
Токены: 10,018 tok

#61 GPT-5.3 Chat

none

Стоимость: $0.008
Время: 8.1s
Токены: 634 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M3	5.5	3.7	66.7%	3		14.95s	2,526	874	3,414
GPT-5.3 Chat	6.7	8.1	58.3%	1		3.86s	606	3,167	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M3	6.1	6.5	55.6%	1		144.74s	5,804	6,223	32,667
GPT-5.3 Chat	5.6	4.7	55.6%	2		10.52s	7,302	6,632	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M3	10.0	10.0	100.0%	0		65.30s	14,760	1,306	6,253
GPT-5.3 Chat	10.0	10.0	100.0%	0		11.96s	11,019	2,614	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M3	10.0	10.0	100.0%	0		14.92s	8,088	514	3,164
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.21s	7,140	942	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M3	5.5	9.3	33.3%	0		233.13s	869	16,254	19,070
GPT-5.3 Chat	3.5	4.4	33.3%	2		13.01s	723	8,264	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M3	5.1	3.4	33.3%	1		33.25s	954	2,487	2,523
GPT-5.3 Chat	4.6	10.0	0.0%	0		1.99s	477	319	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M3	9.8	10.0	100.0%	0		6.14s	1,623	103	920
GPT-5.3 Chat	9.8	10.0	100.0%	0		3.51s	660	1,491	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M3	7.9	9.9	66.7%	0		49.91s	2,079	11,946	13,761
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.99s	642	1,758	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M3	10.0	10.0	100.0%	0		11.91s	9,168	281	555
GPT-5.3 Chat	10.0	10.0	100.0%	0		8.36s	5,445	861	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M3	3.0	10.0	0.0%	0		100.80s	675	9,048	10,216
GPT-5.3 Chat	3.0	10.0	0.0%	0		4.38s	195	569	0

Быстрое сравнение

Сменить пару сравнения

DeepSeek V4 ProhighvsMiniMax M3medium KAT-Coder-Pro V2.5mediumvsGPT-5.3 Chatnone Mercury 2mediumvsGPT-5.3 Chatnone Kimi K2.5mediumvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsQwen3.6 Flashmedium DeepSeek V3.2mediumvsGPT-5.3 Chatnone KAT-Coder-Pro V2.5highvsMiniMax M3medium GPT-5.3 ChatnonevsGrok Build 0.1medium MiniMax M3mediumvsGPT-5.6 Lunahigh MiniMax M3mediumvsStep 3.7 Flashlow DeepSeek V4 ProhighvsGPT-5.3 Chatnone Seed-2.0-MinimediumvsGPT-5.3 Chatnone