Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs Grok 4.20 Beta

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-04

Метрика Claude Sonnet 4.6 Claude Sonnet 4.6 medium Релиз: 2026-02-17 Grok 4.20 Beta Grok 4.20 Beta medium Релиз: 2026-03-12
Оценка 7.9 7.9
Ранг #25 #27
Стабильность 9.5 9.0
Тестов верно
Доля успешных попыток 72.6% 72.6%
Нестабильные тесты 1 2
Всего запусков 51 51
Стоимость за результат 8.531 5.525
Общая стоимость $1.024 $0.608
???? ????? $3.000 / 1M $0.000 / 1M
???? ?????? $15.000 / 1M $0.000 / 1M
Выходные токены 35,174 1,487
Токены рассуждений 24,687 87,922
Время ответа (среднее) 10.09s 8.54s
Время ответа (макс.) 46.35s 24.21s
Время ответа (суммарно) 90.85s 145.26s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 6.5 10.0 50.0% 0 2.98s 1,046 1,093
Grok 4.20 Beta 8.7 7.9 91.7% 1 3.16s 268 7,583
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 46.35s 5,871 3,962
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 227 12,212
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 13.90s 649 742
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.01s 180 5,281
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 2.9 7.2 11.1% 1 0ms 25,790 16,919
Grok 4.20 Beta 5.3 10.0 33.3% 0 21.33s 251 40,255
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.94s 256 433
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 72 3,440
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 2.61s 318 552
Grok 4.20 Beta 8.3 10.0 50.0% 0 4.97s 57 7,107
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.80s 589 635
Grok 4.20 Beta 8.2 7.2 88.9% 1 3.85s 249 6,660
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 7.48s 655 351
Grok 4.20 Beta 3.0 10.0 0.0% 0 12.39s 183 5,384

Быстрое сравнение

Сменить пару сравнения