Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Cobuddy vs DeepSeek: DeepSeek V4 Flash

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-19

Метрика Cobuddy Cobuddy medium Релиз: 2026-05-06 Бесплатно доступно DeepSeek V4 Flash DeepSeek V4 Flash none Релиз: 2026-04-24 Бесплатно доступно
Оценка 5.8 5.2
Ранг #102 #127
Надежность 9.9 10.0
Стабильность 6.9 9.2
Тестов верно
Доля успешных попыток 54.4% 31.6%
Нестабильные тесты 7 2
Всего запусков 57 57
Стоимость за результат 0.000 0.147
Общая стоимость $0.000 $0.008
???? ????? $0.000 / 1M $0.112 / 1M
???? ?????? $0.000 / 1M $0.224 / 1M
Выходные токены 1,648 4,464
Токены рассуждений 96,062 0
Время ответа (среднее) 36.50s 28.01s
Время ответа (макс.) 309.02s 111.96s
Время ответа (суммарно) 693.45s 532.17s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 8.7 7.9 91.7% 1 10.00s 98 4,666
DeepSeek V4 Flash 3.0 10.0 0.0% 0 20.18s 174 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 4.3 1.1 66.7% 1 53.59s 343 9,678
DeepSeek V4 Flash 6.3 10.0 0.0% 0 24.04s 471 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 3.0 10.0 0.0% 0 47.38s 465 7,265
DeepSeek V4 Flash 4.5 2.1 66.7% 1 111.96s 2,664 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 6.3 5.8 66.7% 1 17.36s 275 5,591
DeepSeek V4 Flash 10.0 10.0 100.0% 0 23.79s 195 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 2.9 4.4 22.2% 2 128.15s 10 49,454
DeepSeek V4 Flash 5.3 10.0 33.3% 0 19.73s 18 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 4.2 9.9 0.0% 0 23.23s 76 3,782
DeepSeek V4 Flash 4.2 9.9 0.0% 0 23.74s 67 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 9.8 10.0 100.0% 0 11.60s 64 2,842
DeepSeek V4 Flash 6.5 10.0 50.0% 0 17.54s 321 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 3.5 4.4 33.3% 2 12.91s 175 5,627
DeepSeek V4 Flash 3.1 7.3 11.1% 1 22.96s 207 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 10.0 10.0 100.0% 0 11.19s 133 294
DeepSeek V4 Flash 10.0 10.0 100.0% 0 77.93s 327 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Cobuddy 3.0 10.0 0.0% 0 36.98s 9 6,863
DeepSeek V4 Flash 3.0 10.0 0.0% 0 3.07s 20 0

Быстрое сравнение

Сменить пару сравнения