Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5 Nano

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-12

Метрика Seed-2.0-Lite Seed-2.0-Lite none Релиз: 2026-02-14 GPT-5 Nano GPT-5 Nano medium Релиз: 2025-08-07
Ранг #45 #38
Средний балл 4.9 5.5
Стабильность 7.4 7.0
Стоимость за результат 0.214 0.856
Общая стоимость $0.015 $0.060
Тестов верно
Доля успешных попыток 56.3% 60.4%
Нестабильные тесты 5 6
Всего запусков 48 48
Выходные токены 2,743 4,386
Токены рассуждений 0 142,080
Время ответа (среднее) 2.49s 47.94s
Время ответа (макс.) 6.70s 204.02s
Время ответа (суммарно) 39.91s 431.47s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Средний балл vs Время ответа (среднее)

Общее число выходных токенов

Средний балл vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 4.6 22.2% 2 2.93s 703 0
GPT-5 Nano 7.0 10.0 66.7% 0 37.73s 1,107 19,968
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 0.0% 0 6.59s 498 0
GPT-5 Nano 10.0 10.0 100.0% 0 65.96s 578 17,984
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 9.9 10.0 100.0% 0 1.82s 246 0
GPT-5 Nano 10.0 1.7 50.0% 2 21.42s 453 10,560
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 7.2 22.2% 1 1.33s 17 0
GPT-5 Nano 4.0 4.4 55.6% 2 204.02s 237 64,448
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
GPT-5 Nano 3.0 10.0 0.0% 0 17.51s 202 4,608
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
GPT-5 Nano 9.0 6.8 83.3% 1 11.90s 382 4,096
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 4.0 4.4 55.6% 2 2.46s 620 0
GPT-5 Nano 4.0 7.2 44.4% 1 19.81s 869 13,440
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
GPT-5 Nano 10.0 10.0 100.0% 0 33.30s 558 6,976

Быстрое сравнение

Сменить пару сравнения