Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.4 Nano

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-01

Метрика Claude Sonnet 4.6 Claude Sonnet 4.6 none Релиз: 2026-02-17 GPT-5.4 Nano GPT-5.4 Nano medium Релиз: 2026-03-17
Оценка 7.4 7.6
Ранг #56 #51
Надежность Н/Д Н/Д
Стабильность 9.6 9.0
Тестов верно
Доля успешных попыток 64.8% 68.5%
Нестабильные тесты 1 2
Всего запусков 54 54
Стоимость за результат 2.376 0.747
Общая стоимость $0.262 $0.083
???? ????? $3.000 / 1M $0.200 / 1M
???? ?????? $15.000 / 1M $1.250 / 1M
Выходные токены 7,433 2,946
Токены рассуждений 0 58,132
Время ответа (среднее) 4.98s 11.21s
Время ответа (макс.) 23.84s 94.06s
Время ответа (суммарно) 54.83s 201.80s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 1,214 0
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 683 2,254
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.67s 523 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 13.41s 472 3,616
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 3,766 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 349 5,719
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 252 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 234 516
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 413 0
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 60 43,325
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 192 0
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 179 443
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 90 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 95 521
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.92s 536 0
GPT-5.4 Nano 4.0 7.1 22.2% 1 3.65s 640 1,356
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 234 382

Быстрое сравнение

Сменить пару сравнения