Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs inclusionAI: Ling-2.6-flash

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика Gemini 3.5 Flash Gemini 3.5 Flash low Релиз: 2026-05-19 Ling-2.6-flash Ling-2.6-flash none Релиз: 2026-04-21
Оценка 9.3 5.3
Ранг #3 #128
Надежность 10.0 10.0
Стабильность 10.0 9.2
Тестов верно
Доля успешных попыток 90.0% 35.1%
Нестабильные тесты 0 2
Всего запусков 60 60
Стоимость за результат 1.582 0.005
Общая стоимость $0.285 $0.001
???? ????? $1.500 / 1M $0.010 / 1M
???? ?????? $9.000 / 1M $0.030 / 1M
Выходные токены 2,027 2,878
Токены рассуждений 23,938 0
Время ответа (среднее) 2.98s 9.76s
Время ответа (макс.) 6.44s 35.34s
Время ответа (суммарно) 59.59s 185.37s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.52s 209 2,536
Ling-2.6-flash 6.8 8.1 58.3% 1 11.81s 573 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 6.8 10.0 50.0% 0 5.54s 452 6,839
Ling-2.6-flash 10.0 10.0 100.0% 0 11.21s 381 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.44s 351 3,050
Ling-2.6-flash 3.0 10.0 0.0% 0 35.34s 1,069 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.81s 279 1,164
Ling-2.6-flash 6.5 10.0 50.0% 0 8.48s 246 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 7.7 10.0 66.7% 0 3.39s 12 4,538
Ling-2.6-flash 3.0 10.0 0.0% 0 4.95s 24 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.27s 119 916
Ling-2.6-flash 4.0 10.0 0.0% 0 1.45s 109 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 9.9 10.0 100.0% 0 1.86s 71 1,652
Ling-2.6-flash 9.8 10.0 100.0% 0 5.52s 81 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.35s 288 2,150
Ling-2.6-flash 2.9 7.2 11.1% 1 9.14s 151 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.27s 234 403
Ling-2.6-flash 3.0 10.0 0.0% 0 18.80s 229 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.88s 12 690
Ling-2.6-flash 3.0 10.0 0.0% 0 1.06s 15 0

Быстрое сравнение

Сменить пару сравнения