AI BENCHY Compare
OpenAI: GPT-5.3 Chat vs Z.ai: GLM 5
Сравнить:
Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-03
| Метрика | OpenAI: GPT-5.3 Chat none Релиз: 2026-03-03 | Z.ai: GLM 5 medium Релиз: 2026-02-12 |
|---|---|---|
| Ранг | #14 | #13 |
| Средний балл | 7.27 | 7.29 |
| Стабильность | 8.26 | 8.18 |
| Стоимость за результат | 2.835 | 1.196 |
| Общая стоимость | $0.256 | $0.120 |
| Тестов верно | ||
| Доля успешных попыток | 73.8% | 83.3% |
| Нестабильные тесты | 3 | 3 |
| Выходные токены | 16,339 | 15,923 |
| Токены рассуждений | 0 | 42,557 |
Оценка vs общая стоимость
Разбивка по категориям
| Анти-ИИ уловки | Оценка | Стабильность | Доля успешных попыток | Нестабильные тесты | Тестов верно | Выходные токены | Токены рассуждений |
|---|---|---|---|---|---|---|---|
| OpenAI: GPT-5.3 Chat | 7.33 | 7.49 | 77.8% | 1 | 3,091 | 0 | |
| Z.ai: GLM 5 | 10.00 | 10.00 | 100.0% | 0 | 420 | 4,992 |
| Парсинг и извлечение данных | Оценка | Стабильность | Доля успешных попыток | Нестабильные тесты | Тестов верно | Выходные токены | Токены рассуждений |
|---|---|---|---|---|---|---|---|
| OpenAI: GPT-5.3 Chat | 9.88 | 10.00 | 100.0% | 0 | 942 | 0 | |
| Z.ai: GLM 5 | 5.00 | 5.62 | 83.3% | 1 | 567 | 3,734 |
| Предметно-ориентированное | Оценка | Стабильность | Доля успешных попыток | Нестабильные тесты | Тестов верно | Выходные токены | Токены рассуждений |
|---|---|---|---|---|---|---|---|
| OpenAI: GPT-5.3 Chat | 1.00 | 4.41 | 33.3% | 2 | 8,264 | 0 | |
| Z.ai: GLM 5 | 1.00 | 4.41 | 33.3% | 2 | 14,404 | 24,570 |
| Следование инструкциям | Оценка | Стабильность | Доля успешных попыток | Нестабильные тесты | Тестов верно | Выходные токены | Токены рассуждений |
|---|---|---|---|---|---|---|---|
| OpenAI: GPT-5.3 Chat | 8.50 | 9.99 | 50.0% | 0 | 1,455 | 0 | |
| Z.ai: GLM 5 | 9.50 | 9.99 | 100.0% | 0 | 140 | 2,740 |
| Puzzle Solving | Оценка | Стабильность | Доля успешных попыток | Нестабильные тесты | Тестов верно | Выходные токены | Токены рассуждений |
|---|---|---|---|---|---|---|---|
| OpenAI: GPT-5.3 Chat | 10.00 | 10.00 | 100.0% | 0 | 1,726 | 0 | |
| Z.ai: GLM 5 | 10.00 | 10.00 | 100.0% | 0 | 159 | 5,527 |
| Вызов инструментов | Оценка | Стабильность | Доля успешных попыток | Нестабильные тесты | Тестов верно | Выходные токены | Токены рассуждений |
|---|---|---|---|---|---|---|---|
| OpenAI: GPT-5.3 Chat | 10.00 | 10.00 | 100.0% | 0 | 861 | 0 | |
| Z.ai: GLM 5 | 10.00 | 10.00 | 100.0% | 0 | 233 | 994 |
Быстрое сравнение
Сменить пару сравнения
Gemini 3 Flash PreviewnonevsGLM 5mediumGPT-5.2 ChatnonevsGLM 5mediumClaude Sonnet 4.6mediumvsGPT-5.3 ChatnoneGemini 2.5 FlashmediumvsGPT-5.3 ChatnoneGPT-5.3 ChatnonevsStep 3.5 FlashmediumБесплатно доступноDeepSeek V3.2mediumvsGPT-5.3 ChatnoneGemini 3.1 Flash Lite PreviewmediumvsGPT-5.3 ChatnoneGemini 3.1 Flash Lite PreviewnonevsGLM 5mediumGemini 3.1 Flash Lite PreviewhighvsGLM 5mediumGemini 3.1 Flash Lite PreviewhighvsGPT-5.3 ChatnoneGPT-5.3 ChatnonevsQwen3.5-122B-A10BmediumGemini 3.1 Flash Lite PreviewlowvsGLM 5medium