Anthropic: Claude Opus 4.7 vs Tencent: Hy3 preview
Сводка
Сравнение benchmark Claude Opus 4.7 vs Hy3 preview: Claude Opus 4.7 лидирует по среднему баллу: 7.4 vs 6.8. Hy3 preview имеет более низкую стоимость benchmark: $0.059 vs $0.505. Claude Opus 4.7 быстрее: 3.02s vs 56.57s, с долей успешных попыток 76.2% vs 55.6%.
Рекомендуемая модель: Claude Opus 4.7 - Здесь у него лучший балл (7.4), и он отвечает примерно в 18.7 раза быстрее, чем Hy3 preview.
Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-18
Метрика
Claude Opus 4.7Claude Opus 4.7noneАрхивная модель: эта модель больше не обновляется и не тестируется на новых тестах.Релиз: 2026-04-16
Hy3 previewHy3 previewhighАрхивная модель: эта модель больше не обновляется и не тестируется на новых тестах.Релиз: 2026-04-22
Метрика
Claude Opus 4.7Claude Opus 4.7noneАрхивная модель: эта модель больше не обновляется и не тестируется на новых тестах.Релиз: 2026-04-16
Hy3 previewHy3 previewhighАрхивная модель: эта модель больше не обновляется и не тестируется на новых тестах.Релиз: 2026-04-22
Оценка
7.4Средний балл по всем бенчмарк-тестам.…
6.8Средний балл по всем бенчмарк-тестам.…
Ранг
#49
#74
Надежность
10.0Оценка успеха с первой попытки: 10.0 означает отсутствие повторяемых сбоев целевого API или лимитов до успешных вызовов; зафиксированные сбои снижают оценку.…
10.0Оценка успеха с первой попытки: 10.0 означает отсутствие повторяемых сбоев целевого API или лимитов до успешных вызовов; зафиксированные сбои снижают оценку.…
Стабильность
9.0Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
9.2Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
Тестов верно
Тест считается полностью пройденным, только если все его прогоны успешны.Неверный ответ: 3Время ответа (среднее)3.02sВремя ответа (макс.)18.27sВремя ответа (суммарно)57.44sТест считается полностью пройденным, только если все его прогоны успешны.…
Тест считается полностью пройденным, только если все его прогоны успешны.Ошибка API: 7Неверный ответ: 3Время ответа (среднее)56.57sВремя ответа (макс.)149.94sВремя ответа (суммарно)848.59sТест считается полностью пройденным, только если все его прогоны успешны.…
Доля успешных попыток
76.2%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
55.6%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
Нестабильные тесты
0Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
2Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Всего запусков
57Всего запусков…
63Всего запусков…
Стоимость за результат
3.154Показывает среднюю стоимость одного правильного ответа в бенчмарке в центах (меньше — лучше).…
0.000Показывает среднюю стоимость одного правильного ответа в бенчмарке в центах (меньше — лучше).…
Общая стоимость
$0.505Общая стоимость (текущая цена)…
$0.059Общая стоимость (текущая цена)…
Цена входа
$5.000 / 1MЦена входа…
$0.066 / 1MЦена входа…
Цена выхода
$25.000 / 1MЦена выхода…
$0.260 / 1MЦена выхода…
Общее число входных токенов
69,576Общее число входных токенов…
25,987Общее число входных токенов…
Выходные токены
6,265Выходные токены…
216,719Выходные токены…
Токены рассуждений
0Токены рассуждений…
0Токены рассуждений…
Время ответа (среднее)
3.02sВремя ответа (среднее)…
56.57sВремя ответа (среднее)…
Время ответа (макс.)
18.27sВремя ответа (макс.)…
149.94sВремя ответа (макс.)…
Время ответа (суммарно)
57.44sВремя ответа (суммарно)…
848.59sВремя ответа (суммарно)…
Генерация showcase
Hamster playing table tennis
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
#49 Claude Opus 4.7
none
Стоимость
$0.051
Время
24.2s
Токены
2,181 tok
#74 Hy3 preview
high
Hy3 preview is no longer available as a free model. It has transitioned to a paid model. Continue using it here: https://openrouter.ai/tencent/hy3-preview
Стоимость
$0.000
Время
0.0s
Токены
0 tok
Оценка
-
Стоимость
-
Время
-
Токены
-
Лучшие модели по оценке
Оценка vs общая стоимость
Время ответа (среднее)
Оценка vs Время ответа (среднее)
Общее число выходных токенов
Оценка vs Общее число выходных токенов
Разбивка по категориям
Анти-ИИ уловки
Оценка
Стабильность
Доля успешных попыток
Нестабильные тесты
Тестов верно
Время ответа (среднее)
Входные токены
Выходные токены
Токены рассуждений
Claude Opus 4.7Архивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
8.3Средний балл по всем бенчмарк-тестам.…
10.0Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
75.0%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
0Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Неверный ответ: 1Время ответа (среднее)2.12sВремя ответа (макс.)3.75sВремя ответа (суммарно)8.50sТест считается полностью пройденным, только если все его прогоны успешны.…
2.12sВремя ответа (среднее)…
894Общее число входных токенов…
522Выходные токены…
0Токены рассуждений…
Hy3 previewАрхивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
6.4Средний балл по всем бенчмарк-тестам.…
7.9Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
58.3%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
1Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Ошибка API: 2Время ответа (среднее)15.12sВремя ответа (макс.)19.99sВремя ответа (суммарно)45.37sТест считается полностью пройденным, только если все его прогоны успешны.…
15.12sВремя ответа (среднее)…
373Общее число входных токенов…
6,839Выходные токены…
0Токены рассуждений…
Программирование
Оценка
Стабильность
Доля успешных попыток
Нестабильные тесты
Тестов верно
Время ответа (среднее)
Входные токены
Выходные токены
Токены рассуждений
Claude Opus 4.7Архивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
3.3Средний балл по всем бенчмарк-тестам.…
3.3Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
33.3%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
0Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Нет проваленных ответов.Время ответа (среднее)2.84sВремя ответа (макс.)2.84sВремя ответа (суммарно)2.84sТест считается полностью пройденным, только если все его прогоны успешны.…
2.84sВремя ответа (среднее)…
1,176Общее число входных токенов…
494Выходные токены…
0Токены рассуждений…
Hy3 previewАрхивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
5.3Средний балл по всем бенчмарк-тестам.…
10.0Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
33.3%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
0Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Ошибка API: 2Время ответа (среднее)99.76sВремя ответа (макс.)99.76sВремя ответа (суммарно)99.76sТест считается полностью пройденным, только если все его прогоны успешны.…
99.76sВремя ответа (среднее)…
741Общее число входных токенов…
38,167Выходные токены…
0Токены рассуждений…
Комбинированный
Оценка
Стабильность
Доля успешных попыток
Нестабильные тесты
Тестов верно
Время ответа (среднее)
Входные токены
Выходные токены
Токены рассуждений
Claude Opus 4.7Архивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
9.5Средний балл по всем бенчмарк-тестам.…
10.0Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
100.0%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
0Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Нет проваленных ответов.Время ответа (среднее)18.27sВремя ответа (макс.)18.27sВремя ответа (суммарно)18.27sТест считается полностью пройденным, только если все его прогоны успешны.…
18.27sВремя ответа (среднее)…
37,740Общее число входных токенов…
3,504Выходные токены…
0Токены рассуждений…
Hy3 previewАрхивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
10.0Средний балл по всем бенчмарк-тестам.…
10.0Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
100.0%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
0Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Нет проваленных ответов.Время ответа (среднее)113.09sВремя ответа (макс.)113.09sВремя ответа (суммарно)113.09sТест считается полностью пройденным, только если все его прогоны успешны.…
113.09sВремя ответа (среднее)…
13,119Общее число входных токенов…
31,319Выходные токены…
0Токены рассуждений…
Парсинг и извлечение данных
Оценка
Стабильность
Доля успешных попыток
Нестабильные тесты
Тестов верно
Время ответа (среднее)
Входные токены
Выходные токены
Токены рассуждений
Claude Opus 4.7Архивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
10.0Средний балл по всем бенчмарк-тестам.…
10.0Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
100.0%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
0Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Нет проваленных ответов.Время ответа (среднее)2.15sВремя ответа (макс.)2.33sВремя ответа (суммарно)4.29sТест считается полностью пройденным, только если все его прогоны успешны.…
2.15sВремя ответа (среднее)…
10,533Общее число входных токенов…
324Выходные токены…
0Токены рассуждений…
Hy3 previewАрхивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
6.5Средний балл по всем бенчмарк-тестам.…
10.0Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
50.0%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
0Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Ошибка API: 1Время ответа (среднее)12.11sВремя ответа (макс.)12.11sВремя ответа (суммарно)12.11sТест считается полностью пройденным, только если все его прогоны успешны.…
12.11sВремя ответа (среднее)…
2,316Общее число входных токенов…
4,323Выходные токены…
0Токены рассуждений…
Предметно-ориентированное
Оценка
Стабильность
Доля успешных попыток
Нестабильные тесты
Тестов верно
Время ответа (среднее)
Входные токены
Выходные токены
Токены рассуждений
Claude Opus 4.7Архивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
7.7Средний балл по всем бенчмарк-тестам.…
10.0Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
66.7%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
0Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Неверный ответ: 1Время ответа (среднее)1.19sВремя ответа (макс.)1.40sВремя ответа (суммарно)3.58sТест считается полностью пройденным, только если все его прогоны успешны.…
1.19sВремя ответа (среднее)…
1,020Общее число входных токенов…
78Выходные токены…
0Токены рассуждений…
Hy3 previewАрхивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
5.3Средний балл по всем бенчмарк-тестам.…
7.2Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
44.4%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
1Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Неверный ответ: 2Время ответа (среднее)109.04sВремя ответа (макс.)149.94sВремя ответа (суммарно)327.11sТест считается полностью пройденным, только если все его прогоны успешны.…
109.04sВремя ответа (среднее)…
747Общее число входных токенов…
87,559Выходные токены…
0Токены рассуждений…
Общий интеллект
Оценка
Стабильность
Доля успешных попыток
Нестабильные тесты
Тестов верно
Время ответа (среднее)
Входные токены
Выходные токены
Токены рассуждений
Claude Opus 4.7Архивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
10.0Средний балл по всем бенчмарк-тестам.…
10.0Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
100.0%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
0Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Нет проваленных ответов.Время ответа (среднее)3.47sВремя ответа (макс.)3.47sВремя ответа (суммарно)3.47sТест считается полностью пройденным, только если все его прогоны успешны.…
3.47sВремя ответа (среднее)…
723Общее число входных токенов…
257Выходные токены…
0Токены рассуждений…
Hy3 previewАрхивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
3.0Средний балл по всем бенчмарк-тестам.…
10.0Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
0.0%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
0Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Ошибка API: 1Время ответа (среднее)0msВремя ответа (макс.)0msВремя ответа (суммарно)0msТест считается полностью пройденным, только если все его прогоны успешны.…
0msВремя ответа (среднее)…
0Общее число входных токенов…
0Выходные токены…
0Токены рассуждений…
Следование инструкциям
Оценка
Стабильность
Доля успешных попыток
Нестабильные тесты
Тестов верно
Время ответа (среднее)
Входные токены
Выходные токены
Токены рассуждений
Claude Opus 4.7Архивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
10.0Средний балл по всем бенчмарк-тестам.…
10.0Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
100.0%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
0Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Нет проваленных ответов.Время ответа (среднее)1.46sВремя ответа (макс.)1.68sВремя ответа (суммарно)2.91sТест считается полностью пройденным, только если все его прогоны успешны.…
1.46sВремя ответа (среднее)…
939Общее число входных токенов…
114Выходные токены…
0Токены рассуждений…
Hy3 previewАрхивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
10.0Средний балл по всем бенчмарк-тестам.…
10.0Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
100.0%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
0Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Нет проваленных ответов.Время ответа (среднее)34.36sВремя ответа (макс.)41.83sВремя ответа (суммарно)68.73sТест считается полностью пройденным, только если все его прогоны успешны.…
34.36sВремя ответа (среднее)…
675Общее число входных токенов…
13,483Выходные токены…
0Токены рассуждений…
Решение головоломок
Оценка
Стабильность
Доля успешных попыток
Нестабильные тесты
Тестов верно
Время ответа (среднее)
Входные токены
Выходные токены
Токены рассуждений
Claude Opus 4.7Архивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
10.0Средний балл по всем бенчмарк-тестам.…
10.0Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
100.0%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
0Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Нет проваленных ответов.Время ответа (среднее)2.46sВремя ответа (макс.)3.72sВремя ответа (суммарно)7.38sТест считается полностью пройденным, только если все его прогоны успешны.…
2.46sВремя ответа (среднее)…
939Общее число входных токенов…
597Выходные токены…
0Токены рассуждений…
Hy3 previewАрхивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
7.7Средний балл по всем бенчмарк-тестам.…
10.0Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
66.7%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
0Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Ошибка API: 1Время ответа (среднее)27.94sВремя ответа (макс.)45.06sВремя ответа (суммарно)55.89sТест считается полностью пройденным, только если все его прогоны успешны.…
27.94sВремя ответа (среднее)…
390Общее число входных токенов…
15,567Выходные токены…
0Токены рассуждений…
Вызов инструментов
Оценка
Стабильность
Доля успешных попыток
Нестабильные тесты
Тестов верно
Время ответа (среднее)
Входные токены
Выходные токены
Токены рассуждений
Claude Opus 4.7Архивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
10.0Средний балл по всем бенчмарк-тестам.…
10.0Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
100.0%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
0Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Нет проваленных ответов.Время ответа (среднее)4.74sВремя ответа (макс.)4.74sВремя ответа (суммарно)4.74sТест считается полностью пройденным, только если все его прогоны успешны.…
4.74sВремя ответа (среднее)…
15,339Общее число входных токенов…
372Выходные токены…
0Токены рассуждений…
Hy3 previewАрхивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
10.0Средний балл по всем бенчмарк-тестам.…
10.0Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
100.0%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
0Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Нет проваленных ответов.Время ответа (среднее)78.83sВремя ответа (макс.)78.83sВремя ответа (суммарно)78.83sТест считается полностью пройденным, только если все его прогоны успешны.…
78.83sВремя ответа (среднее)…
7,410Общее число входных токенов…
10,370Выходные токены…
0Токены рассуждений…
Эрудиция
Оценка
Стабильность
Доля успешных попыток
Нестабильные тесты
Тестов верно
Время ответа (среднее)
Входные токены
Выходные токены
Токены рассуждений
Claude Opus 4.7Архивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
3.0Средний балл по всем бенчмарк-тестам.…
10.0Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
0.0%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
0Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Неверный ответ: 1Время ответа (среднее)1.46sВремя ответа (макс.)1.46sВремя ответа (суммарно)1.46sТест считается полностью пройденным, только если все его прогоны успешны.…
1.46sВремя ответа (среднее)…
273Общее число входных токенов…
3Выходные токены…
0Токены рассуждений…
Hy3 previewАрхивная модель: эта модель больше не обновляется и не тестируется на новых тестах.
3.0Средний балл по всем бенчмарк-тестам.…
10.0Оценка стабильности отражает устойчивость между прогонами (10 = очень стабильно, даже если стабильно неверно).…
0.0%Доля успешных попыток = успешные попытки / все попытки по всем прогонам.…
0Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).…
Тест считается полностью пройденным, только если все его прогоны успешны.Неверный ответ: 1Время ответа (среднее)47.71sВремя ответа (макс.)47.71sВремя ответа (суммарно)47.71sТест считается полностью пройденным, только если все его прогоны успешны.…