Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs inclusionAI: Ling-2.6-flash

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика Gemini 3.5 Flash Gemini 3.5 Flash high Релиз: 2026-05-19 Ling-2.6-flash Ling-2.6-flash none Релиз: 2026-04-21
Оценка 9.6 5.3
Ранг #2 #128
Надежность 10.0 10.0
Стабильность 9.6 9.2
Тестов верно
Доля успешных попыток 96.7% 35.1%
Нестабильные тесты 1 2
Всего запусков 60 60
Стоимость за результат 5.231 0.005
Общая стоимость $0.994 $0.001
???? ????? $1.500 / 1M $0.010 / 1M
???? ?????? $9.000 / 1M $0.030 / 1M
Выходные токены 1,969 2,878
Токены рассуждений 102,679 0
Время ответа (среднее) 8.30s 9.76s
Время ответа (макс.) 34.82s 35.34s
Время ответа (суммарно) 165.92s 185.37s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.57s 174 4,997
Ling-2.6-flash 6.8 8.1 58.3% 1 11.81s 573 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 24.62s 450 34,170
Ling-2.6-flash 10.0 10.0 100.0% 0 11.21s 381 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.37s 351 16,323
Ling-2.6-flash 3.0 10.0 0.0% 0 35.34s 1,069 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.43s 279 8,466
Ling-2.6-flash 6.5 10.0 50.0% 0 8.48s 246 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 7.6 7.2 77.8% 1 14.09s 12 24,721
Ling-2.6-flash 3.0 10.0 0.0% 0 4.95s 24 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.63s 115 1,650
Ling-2.6-flash 4.0 10.0 0.0% 0 1.45s 109 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.35s 70 3,799
Ling-2.6-flash 9.8 10.0 100.0% 0 5.52s 81 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.23s 241 4,940
Ling-2.6-flash 2.9 7.2 11.1% 1 9.14s 151 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 9.8 10.0 100.0% 0 4.96s 265 1,608
Ling-2.6-flash 3.0 10.0 0.0% 0 18.80s 229 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.94s 12 2,005
Ling-2.6-flash 3.0 10.0 0.0% 0 1.06s 15 0

Быстрое сравнение

Сменить пару сравнения