AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs Xiaomi: MiMo-V2.5-Pro

Сводка

Сравнение benchmark GPT-5.2 Chat vs MiMo-V2.5-Pro: GPT-5.2 Chat лидирует по среднему баллу: 7.9 vs 7.5. MiMo-V2.5-Pro имеет более низкую стоимость benchmark: $0.106 vs $0.393. GPT-5.2 Chat быстрее: 7.13s vs 26.13s, с долей успешных попыток 74.6% vs 68.3%.

Рекомендуемая модель: MiMo-V2.5-Pro - Его балл близок к лучшему здесь (7.5 против 7.9), при этом он примерно в 3.7 раза дешевле, чем GPT-5.2 Chat.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-04

Метрика	GPT-5.2 Chat GPT-5.2 Chat none Релиз: 2025-12-11	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Релиз: 2026-04-22

Метрика	GPT-5.2 Chat GPT-5.2 Chat none Релиз: 2025-12-11	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Релиз: 2026-04-22
Оценка	7.9	7.5
Ранг	#24	#43
Надежность	10.0	10.0
Стабильность	8.9	8.5
Тестов верно
Доля успешных попыток	74.6%	68.3%
Нестабильные тесты	3	4
Всего запусков	63	63
Стоимость за результат	2.803	2.541
Общая стоимость	$0.393	$0.106
Цена входа	$1.750 / 1M	$0.435 / 1M
Цена выхода	$14.000 / 1M	$0.870 / 1M
Общее число входных токенов	34,212	40,854
Выходные токены	23,744	5,015
Токены рассуждений	0	97,742
Время ответа (среднее)	7.13s	26.13s
Время ответа (макс.)	38.52s	130.77s
Время ответа (суммарно)	149.69s	548.65s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#24 GPT-5.2 Chat

none

Cost: $0.010
Time: 15.3s
Tokens: 797 tok

#43 MiMo-V2.5-Pro

medium

Invalid SVG

Cost: $0.000
Time: 300.0s
Tokens: 0 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	8.7	7.9	91.7%	1		3.40s	606	1,807	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.26s	621	323	1,179

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	8.8	7.8	88.9%	1		9.82s	7,305	6,731	0
MiMo-V2.5-Pro	6.2	4.7	66.7%	2		92.07s	6,543	780	51,218

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	10.0	10.0	100.0%	0		9.12s	11,019	1,243	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		53.36s	15,060	348	11,870

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	10.0	10.0	100.0%	0		3.05s	7,140	980	0
MiMo-V2.5-Pro	7.3	5.8	83.3%	1		18.81s	7,746	260	8,383

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	5.3	10.0	33.3%	0		17.78s	723	7,810	0
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		37.87s	630	275	17,023

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	4.4	3.0	33.3%	1		3.20s	477	335	0
MiMo-V2.5-Pro	5.5	10.0	0.0%	0		4.02s	492	155	163

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	9.8	10.0	100.0%	0		5.51s	660	1,441	0
MiMo-V2.5-Pro	9.9	10.0	100.0%	0		2.77s	672	82	803

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	7.7	10.0	66.7%	0		4.10s	642	1,603	0
MiMo-V2.5-Pro	6.7	7.9	55.6%	1		5.31s	660	540	2,181

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	10.0	10.0	100.0%	0		4.68s	5,445	555	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		16.87s	8,220	311	2,908

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
GPT-5.2 Chat	3.0	10.0	0.0%	0		6.89s	195	1,239	0
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		12.46s	210	1,941	2,014

Быстрое сравнение

Сменить пару сравнения

GPT-5.2 ChatnonevsQwen3.5 Plus 2026-02-15medium GPT-5.2 ChatnonevsGLM 5 Turbomedium GPT-5.2 ChatnonevsStep 3.7 Flashmedium Gemini 3 Flash PreviewnonevsMiMo-V2.5-Promedium GPT-5.2 ChatnonevsQwen3.6 Plusmedium Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2.5-Promedium Gemma 4 31BmediumБесплатно доступноvsGPT-5.2 Chatnone Gemini 2.5 FlashmediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsQwen3.5-122B-A10Bmedium Qwen3.7 MaxnonevsMiMo-V2.5-Promedium GPT-5.2 ChatnonevsQwen3.5-27Bmedium DeepSeek V4 FlashhighvsGPT-5.2 Chatnone