Рейтинг Парсинг и извлечение данных x Неверный ответ

Посмотрите, какие AI-модели чаще всего сталкиваются с Неверный ответ в Парсинг и извлечение данных, чтобы быстрее находить слабые места.

Показано моделей

Всего сбоев

Наиболее затронутая модель

GPT-5 Nano 2

Причины сбоев

Неверный ответ41 Ошибка API14 Нет ответа8 Лишнее форматирование6 Тайм-аут1

Категории

Предметно-ориентированное412 Анти-ИИ уловки293 Программирование252 Решение головоломок201 Эрудиция168 Комбинированный68 Следование инструкциям61 Общий интеллект59 Парсинг и извлечение данных41 Вызов инструментов3

36/36

Ранг	Модель	Компания	Количество Неверный ответ	Оценка категории	Общая стоимость	Тестов верно	Время ответа (среднее)
#109	Mimo V2 PRO medium	Xiaomi	1	7.3	$0.333	1/2	17.2s
Всего тестов 2 Ошибочных тестов 1 Общая стоимость $0.333 Время ответа (среднее) 17.2s
#121	gpt-oss-120b medium	OpenAI	1	6.4	$0.019	1/2	1.98s
Всего тестов 2 Ошибочных тестов 1 Общая стоимость $0.019 Время ответа (среднее) 1.98s
#144	KAT-Coder-Air V2.5 high	Kwaipilot	1	6.5	$0.077	1/2	3.59s
Всего тестов 2 Ошибочных тестов 1 Общая стоимость $0.077 Время ответа (среднее) 3.59s
#149	KAT-Coder-Air V2.5 medium	Kwaipilot	1	6.5	$0.048	1/2	3.65s
Всего тестов 2 Ошибочных тестов 1 Общая стоимость $0.048 Время ответа (среднее) 3.65s
#152	Qwen3.6 27B none	Qwen	1	7.3	$0.087	1/2	2.06s
Всего тестов 2 Ошибочных тестов 1 Общая стоимость $0.087 Время ответа (среднее) 2.06s
#155	Kimi K2.5 none	Moonshot AI	1	7.3	$0.127	1/2	42.1s
Всего тестов 2 Ошибочных тестов 1 Общая стоимость $0.127 Время ответа (среднее) 42.1s
#158	KAT-Coder-Air V2.5 low	Kwaipilot	1	6.5	$0.041	1/2	2.82s
Всего тестов 2 Ошибочных тестов 1 Общая стоимость $0.041 Время ответа (среднее) 2.82s
#166	Qwen3 Coder Next none	Qwen	1	6.5	$0.025	1/2	1.32s
Всего тестов 2 Ошибочных тестов 1 Общая стоимость $0.025 Время ответа (среднее) 1.32s
#172	MiniMax M2.7 medium	Minimax	1	6.3	$0.163	1/2	21.9s
Всего тестов 2 Ошибочных тестов 1 Общая стоимость $0.163 Время ответа (среднее) 21.9s
#173	DeepSeek V3.2 none	DeepSeek	1	6.3	$0.054	1/2	9.42s
Всего тестов 2 Ошибочных тестов 1 Общая стоимость $0.054 Время ответа (среднее) 9.42s
#176	GLM 4.7 Flash none	Z.ai	1	7.3	$0.016	1/2	4.82s
Всего тестов 2 Ошибочных тестов 1 Общая стоимость $0.016 Время ответа (среднее) 4.82s
#178	Ling-2.6-flash none	Inclusionai	1	6.5	$0.002	1/2	8.48s
Всего тестов 2 Ошибочных тестов 1 Общая стоимость $0.002 Время ответа (среднее) 8.48s
#179	Ring-2.6-1T none	Inclusionai	1	3.0	$0.026	0/2	45.9s
Всего тестов 2 Ошибочных тестов 2 Общая стоимость $0.026 Время ответа (среднее) 45.9s
#180	GPT-5.4 Nano none	OpenAI	1	6.5	$0.041	1/2	1.11s
Всего тестов 2 Ошибочных тестов 1 Общая стоимость $0.041 Время ответа (среднее) 1.11s
#187	Qwen3 Coder Next medium	Qwen	1	6.5	$0.032	1/2	81.8s
Всего тестов 2 Ошибочных тестов 1 Общая стоимость $0.032 Время ответа (среднее) 81.8s

Фильтровать модели

Лучшие модели по Количество Неверный ответ

Количество Неверный ответ против Оценка

Лучшие модели по Время ответа (среднее)

Лучшие модели по Оценочная стоимость потерь

Парсинг и извлечение данных: Неверный ответ

Фильтровать модели

Лучшие модели по Количество Неверный ответ

Количество Неверный ответ против Оценка

Лучшие модели по Время ответа (среднее)

Лучшие модели по Оценочная стоимость потерь