Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs Qwen: Qwen3.5 Plus 2026-02-15

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-19

Метрика Gemini 3.5 Flash Gemini 3.5 Flash high Релиз: 2026-05-19 Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Релиз: 2026-02-15
Оценка 9.6 8.2
Ранг #4 #16
Надежность 10.0 10.0
Стабильность 9.6 9.1
Тестов верно
Доля успешных попыток 96.5% 79.0%
Нестабильные тесты 1 2
Всего запусков 57 57
Стоимость за результат 4.294 1.758
Общая стоимость $0.773 $0.247
???? ????? $1.500 / 1M $0.260 / 1M
???? ?????? $9.000 / 1M $1.560 / 1M
Выходные токены 1,945 2,145
Токены рассуждений 78,877 129,019
Время ответа (среднее) 6.90s 51.33s
Время ответа (макс.) 22.37s 120.91s
Время ответа (суммарно) 131.10s 616.01s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.57s 174 4,997
Qwen3.5 Plus 2026-02-15 8.2 7.9 83.3% 1 45.78s 205 21,236
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 14.42s 426 10,368
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 120.91s 367 19,367
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.37s 351 16,323
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.85s 421 7,906
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.43s 279 8,466
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.91s 270 14,916
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 7.6 7.2 77.8% 1 14.09s 12 24,721
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 17.50s 35 16,680
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.63s 115 1,650
Qwen3.5 Plus 2026-02-15 4.7 1.6 66.7% 1 79.86s 73 8,675
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.35s 70 3,799
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 31.93s 101 7,704
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.23s 241 4,940
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 34.57s 340 14,496
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 9.8 10.0 100.0% 0 4.96s 265 1,608
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 7.54s 309 909
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.94s 12 2,005
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 103.81s 24 17,130

Быстрое сравнение

Сменить пару сравнения