Навигация
AI BENCHY
Сравнить Графики
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Inception: Mercury 2 vs OpenAI: GPT-5 Mini

Сравнить:

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-05

Метрика Inception: Mercury 2 none Релиз: 2026-02-24 OpenAI: GPT-5 Mini medium Релиз: 2025-08-07
Ранг #50 #31
Средний балл 3.4 6.1
Тестов верно
Стабильность 8.9 8.9
Стоимость за результат 0.147 1.401
Общая стоимость $0.006 $0.113
Доля успешных попыток 33.3% 62.2%
Нестабильные тесты 2 2
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
Выходные токены 1,144 5,477
Токены рассуждений 0 46,912
Время ответа (среднее) 594ms 25.92s
Время ответа (макс.) 1.27s 88.15s
Время ответа (суммарно) 8.91s 388.79s

Лучшие модели по оценке

Время ответа (среднее)

Оценка vs общая стоимость

Средний балл vs Время ответа (среднее)

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Inception: Mercury 2 10.0 10.0 0.0% 0 466ms 274 0
OpenAI: GPT-5 Mini 7.0 9.6 66.7% 0 16.45s 1,645 5,824
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Inception: Mercury 2 10.0 10.0 0.0% 0 606ms 131 0
OpenAI: GPT-5 Mini 10.0 10.0 100.0% 0 88.15s 754 11,520
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Inception: Mercury 2 5.5 5.9 83.3% 1 667ms 180 0
OpenAI: GPT-5 Mini 9.9 10.0 100.0% 0 12.58s 453 3,200
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Inception: Mercury 2 4.0 7.2 44.4% 1 534ms 46 0
OpenAI: GPT-5 Mini 10.0 7.2 22.2% 1 44.63s 293 14,016
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Inception: Mercury 2 5.5 10.0 50.0% 0 551ms 82 0
OpenAI: GPT-5 Mini 7.5 6.6 83.3% 1 15.66s 318 4,992
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Inception: Mercury 2 10.0 10.0 0.0% 0 533ms 234 0
OpenAI: GPT-5 Mini 4.3 9.8 33.3% 0 14.09s 1,527 5,760
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Inception: Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
OpenAI: GPT-5 Mini 10.0 10.0 100.0% 0 18.64s 487 1,600

Быстрое сравнение

Сменить пару сравнения