Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 5 vs Cobuddy

Сводка

Сравнение benchmark Claude Sonnet 5 vs Cobuddy: Claude Sonnet 5 лидирует по среднему баллу: 5.7 vs 4.9. Cobuddy имеет более низкую стоимость benchmark: $0.000 vs $0.287. Claude Sonnet 5 быстрее: 4.74s vs 39.90s, с долей успешных попыток 42.9% vs 47.6%.

Рекомендуемая модель: Claude Sonnet 5 - Здесь у него лучший балл (5.7), и он отвечает примерно в 8.4 раза быстрее, чем Cobuddy.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-30

Метрика Claude Sonnet 5 Claude Sonnet 5 none Релиз: 2026-06-30 Cobuddy Cobuddy medium Релиз: 2026-05-06
Оценка 5.7 4.9
Ранг #117 #143
Надежность 10.0 10.0
Стабильность 8.6 7.5
Тестов верно
Доля успешных попыток 42.9% 47.6%
Нестабильные тесты 4 6
Всего запусков 63 63
Стоимость за результат 4.098 0.000
Общая стоимость $0.287 $0.000
Цена входа $2.000 / 1M $0.000 / 1M
Цена выхода $10.000 / 1M $0.000 / 1M
Общее число входных токенов 76,797 37,449
Выходные токены 13,325 1,677
Токены рассуждений 0 116,703
Время ответа (среднее) 4.74s 39.90s
Время ответа (макс.) 29.46s 309.02s
Время ответа (суммарно) 99.46s 797.98s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 Claude Sonnet 5

none
Стоимость
$0.061
Время
53.7s
Токены
6,172 tok

#143 Cobuddy

medium
No endpoints found for baidu/cobuddy:free.
Стоимость
$0.000
Время
0.1s
Токены
0 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 5.3 10.0 25.0% 0 3.60s 834 1,813 0
Cobuddy 8.7 7.9 91.7% 1 10.00s 453 98 4,666
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 4.6 7.9 22.2% 1 3.67s 10,590 1,864 0
Cobuddy 3.7 6.7 22.2% 1 79.17s 4,726 358 30,138
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 3.0 10.0 0.0% 0 29.46s 38,775 6,340 0
Cobuddy 3.0 10.0 0.0% 0 47.38s 18,324 465 7,265
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 10.0 10.0 100.0% 0 3.01s 10,503 309 0
Cobuddy 6.3 5.8 66.7% 1 17.36s 8,181 275 5,591
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 5.3 7.2 44.4% 1 3.28s 975 933 0
Cobuddy 2.9 4.4 22.2% 2 128.15s 540 10 49,454
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 4.7 3.1 33.3% 1 2.81s 708 272 0
Cobuddy 4.2 9.9 0.0% 0 23.23s 498 76 3,782
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 6.4 10.0 50.0% 0 2.58s 909 103 0
Cobuddy 9.8 10.0 100.0% 0 11.60s 508 64 2,842
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 6.0 7.4 55.6% 1 3.22s 894 778 0
Cobuddy 3.6 7.2 22.2% 1 12.83s 561 189 5,808
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 10.0 10.0 100.0% 0 6.80s 12,351 522 0
Cobuddy 10.0 10.0 100.0% 0 11.19s 3,505 133 294
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Sonnet 5 3.0 10.0 0.0% 0 4.31s 258 391 0
Cobuddy 3.0 10.0 0.0% 0 36.98s 153 9 6,863

Быстрое сравнение

Сменить пару сравнения