???? ?????
$1.200 / 1M
???? ??????
$4.000 / 1M
Нестабильные тесты
6
Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).
Графики
Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.
Оценка vs Общая стоимость
Время ответа (среднее)
Оценка vs Время ответа (среднее)
Общее число выходных токенов
Оценка vs Общее число выходных токенов
Быстрое сравнение
GLM 5V TurbomediumvsGemini 3.1 Flash Lite PreviewnoneGLM 5V TurbomediumvsKimi K2.6mediumGLM 5V TurbomediumvsStep 3.5 FlashmediumGLM 5V TurbomediumvsGemma 4 26B A4BmediumБесплатно доступноGLM 5V TurbomediumvsGemini 3.1 Flash LitelowGLM 5V TurbomediumvsGemini 3 Flash PreviewmediumGLM 5V TurbomediumvsGemini 3.1 Pro PreviewmediumGLM 5V TurbomediumvsRing 2.6 1tmediumБесплатно доступно
Разбивка по категориям
| Категория | Оценка | Стабильность | Тестов верно |
|---|---|---|---|
| Анти-ИИ уловки | 7.2 | 6.1 | |
| Программирование | 10.0 | 10.0 | |
| Комбинированный | 6.9 | 3.8 | |
| Парсинг и извлечение данных | 10.0 | 10.0 | |
| Предметно-ориентированное | 5.3 | 7.2 | |
| Общий интеллект | 10.0 | 10.0 | |
| Следование инструкциям | 9.9 | 10.0 | |
| Решение головоломок | 7.6 | 7.2 | |
| Вызов инструментов | 7.0 | 3.7 | |
| Эрудиция | 3.0 | 10.0 |