Сравнить Графики

Язык:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: GPT-5 Mini vs Z.ai: GLM 4.7 Flash

Сравнить:

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-05

Метрика	OpenAI: GPT-5 Mini medium Релиз: 2025-08-07	Z.ai: GLM 4.7 Flash none Релиз: 2026-01-19
Средний балл	6.1	3.9
Тестов верно
Ранг	#31	#47
Стабильность	8.9	8.3
Стоимость за результат	1.401	0.064
Общая стоимость	$0.113	$0.003
Доля успешных попыток	62.2%	37.8%
Нестабильные тесты	2	3
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
Выходные токены	5,477	1,721
Токены рассуждений	46,912	0
Время ответа (среднее)	25.92s	3.16s
Время ответа (макс.)	88.15s	7.05s
Время ответа (суммарно)	388.79s	25.31s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Средний балл vs Время ответа (среднее)

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
OpenAI: GPT-5 Mini	7.0	9.6	66.7%	0		16.45s	1,645	5,824
Z.ai: GLM 4.7 Flash	10.0	7.2	22.2%	1		6.59s	430	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
OpenAI: GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	754	11,520
Z.ai: GLM 4.7 Flash	10.0	10.0	0.0%	0		3.22s	704	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
OpenAI: GPT-5 Mini	9.9	10.0	100.0%	0		12.58s	453	3,200
Z.ai: GLM 4.7 Flash	5.4	5.8	83.3%	1		4.82s	196	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
OpenAI: GPT-5 Mini	10.0	7.2	22.2%	1		44.63s	293	14,016
Z.ai: GLM 4.7 Flash	7.0	10.0	66.7%	0		744ms	19	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
OpenAI: GPT-5 Mini	7.5	6.6	83.3%	1		15.66s	318	4,992
Z.ai: GLM 4.7 Flash	5.5	10.0	50.0%	0		888ms	62	0

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
OpenAI: GPT-5 Mini	4.3	9.8	33.3%	0		14.09s	1,527	5,760
Z.ai: GLM 4.7 Flash	3.7	10.0	0.0%	0		1.00s	98	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
OpenAI: GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	487	1,600
Z.ai: GLM 4.7 Flash	10.0	1.6	33.3%	1		7.05s	212	0

Быстрое сравнение

Сменить пару сравнения

GPT-5 MinimediumvsGLM 5none GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none Qwen3 Coder NextmediumvsGLM 4.7 Flashnone Claude Sonnet 4.6nonevsGPT-5 Minimedium Gemini 2.5 FlashnonevsGPT-5 Minimedium DeepSeek V3.2nonevsGPT-5 Minimedium MiniMax M2.5mediumvsGLM 4.7 Flashnone Gemini 3 Flash PreviewnonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5-122B-A10Bnone GPT-5 MinimediumvsQwen3.5-Flashnone GPT-5 MinimediumvsQwen3.5-27Bnone gpt-oss-120bmediumБесплатно доступноvsGLM 4.7 Flashnone