AI BENCHY
Сравнить
❤️ Made by XCS

Название модели

OpenAI: gpt-oss-120b

Бенчмарки сгенерированы из тестовых наборов Aibenchy в : 19 февр. 2026 г.

Метрика OpenAI: gpt-oss-120b
Ранг#12
КомпанияOpenAI
Score 5.75
Стабильность 7.19
Стоимость за результат 0.0951
Общая стоимость $0.00571
Тестов верно 6/12
Доля успешных попыток 63.9%
Нестабильные тесты 4
Выходные токены 8,060
Токены рассуждений 23,792

Разбивка по категориям

Категория Полностью пройденные тесты Score Стабильность Доля успешных попыток Нестабильные тесты Оценка рассуждения Стоимость
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 10.00 $0.00029
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 10.00 $0.00052
Domain specific 0/3 1.00 4.41 22.2% 2 8.53 $0.00393
Instructions following 2/2 10.00 10.00 100.0% 0 9.50 $0.00040
Puzzle Solving 1/3 5.00 7.13 44.4% 1 7.89 $0.00059

Сравниваемые модели

Сравнить OpenAI: gpt-oss-120b с...

#11 · OpenAI

OpenAI: GPT-5 Nano

Рассуждение (medium)

Score: 5.92

Стабильность: 6.03

Доля успешных попыток: 72.2%

Нестабильные тесты: 6

Стоимость за результат: 0.4675

Тестов верно: 6/12

Общая стоимость: $0.02806

Сравнить

#13 · Anthropic

Anthropic: Claude Sonnet 4.6

Без рассуждения

Score: 5.75

Стабильность: 9.42

Доля успешных попыток: 52.8%

Нестабильные тесты: 1

Стоимость за результат: 0.9480

Тестов верно: 6/12

Общая стоимость: $0.05688

Сравнить

#10 · Google

Google: Gemini 3 Flash Preview

Без рассуждения

Score: 6.25

Стабильность: 8.60

Доля успешных попыток: 66.7%

Нестабильные тесты: 2

Стоимость за результат: 0.0754

Тестов верно: 7/12

Общая стоимость: $0.00528

Сравнить

Быстрое сравнение

Сравнить OpenAI: gpt-oss-120b с...