Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 2.5 Flash vs Qwen: Qwen3.5-27B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-02

Метрика Gemini 2.5 Flash Gemini 2.5 Flash none Релиз: 2025-06-17 Qwen3.5-27B Qwen3.5-27B none Релиз: 2026-02-24
Оценка 6.4 5.8
Ранг #95 #112
Надежность 10.0 10.0
Стабильность 9.6 9.3
Тестов верно
Доля успешных попыток 48.3% 40.0%
Нестабильные тесты 1 2
Всего запусков 60 60
Стоимость за результат 0.159 0.241
Общая стоимость $0.015 $0.014
Цена входа $0.300 / 1M $0.195 / 1M
Цена выхода $2.500 / 1M $1.560 / 1M
Общее число входных токенов 32,923 41,637
Выходные токены 1,764 3,585
Токены рассуждений 0 0
Время ответа (среднее) 889ms 1.69s
Время ответа (макс.) 4.39s 9.39s
Время ответа (суммарно) 17.79s 33.82s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 3.0 10.0 0.0% 0 582ms 492 102 0
Qwen3.5-27B 4.8 10.0 25.0% 0 788ms 696 267 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 6.8 10.0 50.0% 0 810ms 5,119 477 0
Qwen3.5-27B 7.3 10.0 50.0% 0 1.98s 5,072 408 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 3.0 10.0 0.0% 0 4.39s 12,519 366 0
Qwen3.5-27B 2.8 1.6 33.3% 1 9.39s 16,918 1,461 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 10.0 10.0 100.0% 0 652ms 7,257 279 0
Qwen3.5-27B 10.0 10.0 100.0% 0 1.43s 7,794 243 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 5.9 7.2 55.6% 1 495ms 633 12 0
Qwen3.5-27B 3.0 10.0 0.0% 0 540ms 789 15 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 5.0 10.0 0.0% 0 615ms 486 78 0
Qwen3.5-27B 5.0 10.0 0.0% 0 2.51s 522 126 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 10.0 10.0 100.0% 0 590ms 615 72 0
Qwen3.5-27B 6.3 10.0 50.0% 0 1.03s 711 69 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 7.7 10.0 66.7% 0 604ms 558 132 0
Qwen3.5-27B 6.7 7.9 55.6% 1 1.38s 714 683 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.91s 5,088 234 0
Qwen3.5-27B 10.0 10.0 100.0% 0 3.54s 8,211 303 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 2.5 Flash 3.0 10.0 0.0% 0 1.15s 156 12 0
Qwen3.5-27B 3.0 10.0 0.0% 0 599ms 210 10 0

Быстрое сравнение

Сменить пару сравнения