Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.5

Сводка

Сравнение benchmark Gemini 3.1 Flash Lite Preview vs GPT-5.5: GPT-5.5 лидирует по среднему баллу: 8.8 vs 7.2. Gemini 3.1 Flash Lite Preview имеет более низкую стоимость benchmark: $0.018 vs $3.679. Gemini 3.1 Flash Lite Preview быстрее: 1.21s vs 37.98s, с долей успешных попыток 60.3% vs 87.3%.

Рекомендуемая модель: Gemini 3.1 Flash Lite Preview - Он дает лучший общий компромисс: конкурентный балл (7.2), ниже стоимость, чем у GPT-5.5, и сбалансированное время ответа.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-04

Метрика Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Релиз: 2026-03-03 GPT-5.5 GPT-5.5 medium Релиз: 2026-04-24
Оценка 7.2 8.8
Ранг #58 #9
Надежность 10.0 10.0
Стабильность 9.7 8.9
Тестов верно
Доля успешных попыток 60.3% 87.3%
Нестабильные тесты 1 3
Всего запусков 63 63
Стоимость за результат 0.148 21.638
Общая стоимость $0.018 $3.679
Цена входа $0.250 / 1M $5.000 / 1M
Цена выхода $1.500 / 1M $30.000 / 1M
Общее число входных токенов 37,582 34,212
Выходные токены 5,547 1,985
Токены рассуждений 0 114,925
Время ответа (среднее) 1.21s 37.98s
Время ответа (макс.) 3.39s 332.10s
Время ответа (суммарно) 25.45s 797.60s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#58 Gemini 3.1 Flash Lite Preview

none
Cost
$0.003
Time
4.7s
Tokens
1,827 tok

#9 GPT-5.5

medium
Cost
$0.112
Time
71.9s
Tokens
3,807 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 7.5 8.4 66.7% 1 1.04s 504 1,092 0
GPT-5.5 10.0 10.0 100.0% 0 4.66s 606 250 1,335
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 5.5 10.0 33.3% 0 967ms 8,128 670 0
GPT-5.5 8.8 7.8 88.9% 1 59.77s 7,305 362 24,959
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 3.20s 13,026 339 0
GPT-5.5 10.0 10.0 100.0% 0 19.29s 11,019 312 2,841
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.22s 7,550 399 0
GPT-5.5 10.0 10.0 100.0% 0 4.18s 7,140 234 593
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 942ms 641 568 0
GPT-5.5 5.3 7.2 44.4% 1 164.14s 723 67 79,625
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 741ms 488 69 0
GPT-5.5 10.0 10.0 100.0% 0 4.16s 477 138 223
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.13s 623 574 0
GPT-5.5 10.0 10.0 100.0% 0 3.36s 660 93 538
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 900ms 570 1,045 0
GPT-5.5 10.0 10.0 100.0% 0 6.76s 642 241 2,225
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.39s 5,894 782 0
GPT-5.5 10.0 10.0 100.0% 0 10.57s 5,445 258 832
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 814ms 158 9 0
GPT-5.5 2.8 1.6 33.3% 1 37.86s 195 30 1,754

Быстрое сравнение

Сменить пару сравнения