Сравнить Графики

Язык:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Qwen: Qwen3.5-122B-A10B

Название модели:

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в : 2026-02-27 15:16

Сводка

Метрика	Google: Gemini 3 Flash Preview low Релиз: Дата релиза неизвестна	Qwen: Qwen3.5-122B-A10B none Релиз: Дата релиза неизвестна
Ранг	#6	#27
Оценка	8.36	5.20
Стабильность	9.40	9.99
Стоимость за результат	0.602	0.206
Общая стоимость	$0.067	$0.013
Тестов верно
Ошибочных тестов	3	8
Доля успешных попыток	81.0%	42.9%
Нестабильные тесты	1	0
Выходные токены	1,170	1,515
Токены рассуждений	18,372	0

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Выходные токены	Токены рассуждений
Google: Gemini 3 Flash Preview	10.00	10.00	100.0%	0		275	2,476
Qwen: Qwen3.5-122B-A10B	4.00	10.00	33.3%	0		309	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Выходные токены	Токены рассуждений
Google: Gemini 3 Flash Preview	10.00	10.00	100.0%	0		305	3,004
Qwen: Qwen3.5-122B-A10B	9.88	10.00	100.0%	0		243	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Выходные токены	Токены рассуждений
Google: Gemini 3 Flash Preview	4.00	7.21	44.4%	1		12	6,410
Qwen: Qwen3.5-122B-A10B	4.00	10.00	33.3%	0		15	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Выходные токены	Токены рассуждений
Google: Gemini 3 Flash Preview	7.50	9.99	50.0%	0		71	2,752
Qwen: Qwen3.5-122B-A10B	3.00	9.95	0.0%	0		70	0

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Выходные токены	Токены рассуждений
Google: Gemini 3 Flash Preview	10.00	10.00	100.0%	0		273	3,315
Qwen: Qwen3.5-122B-A10B	4.33	10.00	33.3%	0		614	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Выходные токены	Токены рассуждений
Google: Gemini 3 Flash Preview	10.00	10.00	100.0%	0		234	415
Qwen: Qwen3.5-122B-A10B	10.00	10.00	100.0%	0		264	0

Сменить пару сравнения

Сравнить Google: Gemini 3 Flash Preview с...

Сравнить Qwen: Qwen3.5-122B-A10B с...