AI BENCHY Compare

OpenAI: GPT-5.3-Codex vs Z.ai: GLM 5 Turbo

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-17

Метрика	GPT-5.3-Codex GPT-5.3-Codex medium Релиз: 2026-02-05	GLM 5 Turbo GLM 5 Turbo medium Релиз: 2026-03-15

Метрика	GPT-5.3-Codex GPT-5.3-Codex medium Релиз: 2026-02-05	GLM 5 Turbo GLM 5 Turbo medium Релиз: 2026-03-15
Ранг	#6	#16
Оценка	8.5	8.0
Стабильность	8.6	7.9
Стоимость за результат	4.526	1.509
Общая стоимость	$0.544	$0.166
Тестов верно
Доля успешных попыток	82.4%	76.5%
Нестабильные тесты	3	5
Всего запусков	51	51
Выходные токены	1,788	11,865
Токены рассуждений	33,649	35,632
Время ответа (среднее)	15.76s	17.98s
Время ответа (макс.)	100.93s	194.23s
Время ответа (суммарно)	267.97s	305.72s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.3-Codex	8.7	7.9	91.7%	1		4.16s	240	1,722
GLM 5 Turbo	10.0	10.0	100.0%	0		4.82s	362	3,137

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.3-Codex	10.0	10.0	100.0%	0		19.56s	364	2,731
GLM 5 Turbo	10.0	10.0	100.0%	0		13.88s	390	2,037

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.07s	234	728
GLM 5 Turbo	10.0	10.0	100.0%	0		6.19s	577	3,632

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.3-Codex	5.9	7.2	55.6%	1		64.31s	64	25,308
GLM 5 Turbo	2.9	4.4	22.2%	2		71.07s	9,665	19,279

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.3-Codex	4.6	10.0	0.0%	0		4.87s	187	331
GLM 5 Turbo	6.1	3.1	66.7%	1		10.05s	60	2,216

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.04s	93	693
GLM 5 Turbo	10.0	10.0	100.0%	0		5.38s	255	2,183

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.3-Codex	9.0	7.9	88.9%	1		5.12s	352	1,644
GLM 5 Turbo	7.3	5.8	55.6%	2		5.44s	315	2,702

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.3-Codex	10.0	10.0	100.0%	0		6.37s	254	492
GLM 5 Turbo	10.0	10.0	100.0%	0		9.84s	241	446

Быстрое сравнение

Сменить пару сравнения

Gemini 3.1 Flash Lite PreviewlowvsGLM 5 Turbomedium Gemini 3 Flash PreviewnonevsGLM 5 Turbomedium Gemini 3.1 Flash Lite PreviewnonevsGLM 5 Turbomedium GPT-5.2 ChatnonevsGLM 5 Turbomedium Gemini 3 Flash PreviewlowvsGPT-5.3-Codexmedium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.3-Codexmedium Gemini 3 Flash PreviewnonevsGPT-5.3-Codexmedium GPT-5.3 ChatnonevsGLM 5 Turbomedium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.3-Codexmedium Gemini 3 Flash PreviewlowvsGLM 5 Turbomedium Claude Sonnet 4.6nonevsGLM 5 Turbomedium Claude Sonnet 4.6nonevsGPT-5.3-Codexmedium