Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs Qwen: Qwen3.6 27B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-08

Метрика Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Релиз: 2026-05-08 Qwen3.6 27B Qwen3.6 27B medium Релиз: 2026-04-20
Оценка 6.8 6.8
Ранг #68 #70
Надежность 10.0 10.0
Стабильность 8.7 8.0
Тестов верно
Доля успешных попыток 59.7% 61.4%
Нестабильные тесты 3 5
Всего запусков 57 57
Стоимость за результат 0.111 2.543
Общая стоимость $0.012 $0.229
???? ????? $0.250 / 1M $0.320 / 1M
???? ?????? $1.500 / 1M $3.200 / 1M
Выходные токены 2,457 8,680
Токены рассуждений 0 96,890
Время ответа (среднее) 1.41s 52.13s
Время ответа (макс.) 4.49s 168.22s
Время ответа (суммарно) 26.72s 990.48s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 8.3 10.0 75.0% 0 1.10s 639 0
Qwen3.6 27B 8.3 10.0 75.0% 0 12.62s 582 4,311
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.31s 636 0
Qwen3.6 27B 10.0 10.0 100.0% 0 168.22s 433 17,861
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.53s 357 0
Qwen3.6 27B 7.0 3.7 66.7% 1 83.07s 2,088 14,689
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.04s 279 0
Qwen3.6 27B 3.5 1.4 50.0% 2 37.30s 568 9,404
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 1.02s 15 0
Qwen3.6 27B 2.9 7.2 11.1% 1 73.38s 3,510 20,352
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 791ms 63 0
Qwen3.6 27B 6.5 3.4 66.7% 1 39.53s 81 3,045
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 932ms 72 0
Qwen3.6 27B 10.0 10.0 100.0% 0 37.96s 346 6,548
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 6.0 4.6 66.7% 2 2.15s 153 0
Qwen3.6 27B 7.7 10.0 66.7% 0 60.21s 281 11,919
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 3.51s 234 0
Qwen3.6 27B 10.0 10.0 100.0% 0 16.88s 390 2,954
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 724ms 9 0
Qwen3.6 27B 3.0 10.0 0.0% 0 80.99s 401 5,807

Быстрое сравнение

Сменить пару сравнения