Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 5 vs OpenAI: GPT-5.4 Mini

Сводка

Сравнение benchmark Claude Sonnet 5 vs GPT-5.4 Mini: GPT-5.4 Mini лидирует по среднему баллу: 8.0 vs 7.9. GPT-5.4 Mini имеет более низкую стоимость benchmark: $0.526 vs $0.550. Claude Sonnet 5 быстрее: 9.94s vs 22.34s, с долей успешных попыток 79.4% vs 73.0%.

Рекомендуемая модель: Claude Sonnet 5 - Его балл близок к лучшему здесь (7.9 против 8.0), и он отвечает примерно в 2.2 раза быстрее, чем GPT-5.4 Mini.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-30

Метрика Claude Sonnet 5 Claude Sonnet 5 medium Релиз: 2026-06-30 GPT-5.4 Mini GPT-5.4 Mini medium Релиз: 2026-03-17
Оценка 7.9 8.0
Ранг #30 #27
Надежность 10.0 10.0
Стабильность 9.0 8.0
Тестов верно
Доля успешных попыток 79.4% 73.0%
Нестабильные тесты 3 5
Всего запусков 63 63
Стоимость за результат 3.662 4.381
Общая стоимость $0.550 $0.526
Цена входа $2.000 / 1M $0.750 / 1M
Цена выхода $10.000 / 1M $4.500 / 1M
Общее число входных токенов 67,416 34,116
Выходные токены 34,012 2,181
Токены рассуждений 7,673 108,937
Время ответа (среднее) 9.94s 22.34s
Время ответа (макс.) 56.94s 138.75s
Время ответа (суммарно) 208.71s 469.20s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#30 Claude Sonnet 5

medium
Стоимость
$0.007
Время
6.4s
Токены
832 tok

#27 GPT-5.4 Mini

medium
Стоимость
$0.056
Время
95.5s
Токены
12,464 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 10.0 10.0 100.0% 0 3.80s 834 1,220 446
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 606 296 2,876
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 9.0 7.9 88.9% 1 17.28s 10,590 13,153 2,379
GPT-5.4 Mini 8.4 7.4 88.9% 1 57.87s 7,305 467 40,902
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 4.5 2.1 66.7% 1 37.01s 29,394 4,848 2,170
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 11,019 317 4,317
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 10.0 10.0 100.0% 0 3.16s 10,503 312 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 7,140 234 650
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 7.7 10.0 66.7% 0 20.38s 975 12,140 1,994
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 619 60 43,286
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 4.8 3.2 33.3% 1 4.32s 708 264 0
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 477 150 510
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 9.9 10.0 100.0% 0 3.10s 909 318 269
GPT-5.4 Mini 9.8 10.0 100.0% 0 2.13s 660 96 1,185
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 7.7 10.0 66.7% 0 2.98s 894 407 121
GPT-5.4 Mini 7.8 10.0 66.7% 0 4.37s 642 278 2,443
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 10.0 10.0 100.0% 0 10.70s 12,351 433 90
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 5,453 251 2,594
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 3.0 10.0 0.0% 0 7.06s 258 917 204
GPT-5.4 Mini 3.0 10.0 0.0% 0 30.10s 195 32 10,174

Быстрое сравнение

Сменить пару сравнения