Orodha ya kushindwa kwa Hakuna jibu

Ona ni modeli gani za AI hukutana na Hakuna jibu mara nyingi zaidi ili utambue hatari za utegemevu kabla ya kuchagua. Panga kwa: Muda wa majibu (wastani) ↑.

Modeli zilizoonyeshwa

Jumla ya kushindwa

Modeli iliyoathirika zaidi

Gemini 3.1 Flash Lite Preview 1

Kategoria

Katika kategoria Mchanganyiko29 Katika kategoria Uandishi wa msimbo18 Katika kategoria Maarifa ya jumla13 Katika kategoria Mahususi kwa domeni8 Katika kategoria Uchanganuzi na uchimbaji wa data8 Katika kategoria Mbinu za kupinga AI4 Katika kategoria Utatuzi wa mafumbo3 Katika kategoria Mwito wa zana2 Katika kategoria Ufuataji wa maagizo2

67/67

Nafasi	Modeli	Kampuni	Idadi ya Hakuna jibu	Alama	Jumla ya gharama	Majaribio sahihi	Muda wa majibu (wastani)
#106	Gemini 3.1 Flash Lite Preview none	Google	1	6.4	$0.052	12/22	1.58s
Jumla ya majaribio 22 Majaribio yenye makosa 10 Jumla ya gharama $0.052 Muda wa majibu (wastani) 1.58s
#132	GPT-5.6 Terra none	OpenAI	1	6.0	$0.349	8/22	1.65s
Jumla ya majaribio 22 Majaribio yenye makosa 14 Jumla ya gharama $0.349 Muda wa majibu (wastani) 1.65s
#122	Gemini 3.1 Flash Lite none	Google	1	6.1	$0.046	9/22	1.75s
Jumla ya majaribio 22 Majaribio yenye makosa 13 Jumla ya gharama $0.046 Muda wa majibu (wastani) 1.75s
#120	Gemini 3.1 Flash Lite minimal	Google	1	6.1	$0.047	10/22	1.86s
Jumla ya majaribio 22 Majaribio yenye makosa 12 Jumla ya gharama $0.047 Muda wa majibu (wastani) 1.86s
#174	GPT-4o-mini none	OpenAI	1	5.0	$0.010	5/22	1.99s
Jumla ya majaribio 22 Majaribio yenye makosa 17 Jumla ya gharama $0.010 Muda wa majibu (wastani) 1.99s
#180	GPT-5.4 Nano none	OpenAI	1	4.8	$0.041	4/22	2.57s
Jumla ya majaribio 22 Majaribio yenye makosa 18 Jumla ya gharama $0.041 Muda wa majibu (wastani) 2.57s
#89	Gemini 3 Flash Preview none	Google	1	6.8	$0.085	13/22	2.95s
Jumla ya majaribio 22 Majaribio yenye makosa 9 Jumla ya gharama $0.085 Muda wa majibu (wastani) 2.95s
#154	MiMo-V2.5-Pro none	Xiaomi	1	5.5	$0.068	6/22	4.12s
Jumla ya majaribio 22 Majaribio yenye makosa 16 Jumla ya gharama $0.068 Muda wa majibu (wastani) 4.12s
#116	Seed-2.0-Lite none	Bytedance Seed	1	6.2	$0.066	8/22	4.40s
Jumla ya majaribio 22 Majaribio yenye makosa 14 Jumla ya gharama $0.066 Muda wa majibu (wastani) 4.40s
#168	MiMo-V2.5 none	Xiaomi	1	5.1	$0.025	5/22	4.62s
Jumla ya majaribio 22 Majaribio yenye makosa 17 Jumla ya gharama $0.025 Muda wa majibu (wastani) 4.62s
#66	Claude Opus 4.8 none	Anthropic	1	7.3	$1.166	13/22	4.91s
Jumla ya majaribio 22 Majaribio yenye makosa 9 Jumla ya gharama $1.166 Muda wa majibu (wastani) 4.91s
#161	Qwen3.6 35B A3B none	Qwen	1	5.3	$0.061	4/22	5.52s
Jumla ya majaribio 22 Majaribio yenye makosa 18 Jumla ya gharama $0.061 Muda wa majibu (wastani) 5.52s
#112	Claude Sonnet 5 none	Anthropic	2	6.3	$0.548	8/22	6.04s
Jumla ya majaribio 22 Majaribio yenye makosa 14 Jumla ya gharama $0.548 Muda wa majibu (wastani) 6.04s
#151	GLM 5.1 none	Z.ai	1	5.5	$0.164	7/22	6.70s
Jumla ya majaribio 22 Majaribio yenye makosa 15 Jumla ya gharama $0.164 Muda wa majibu (wastani) 6.70s
#198	Laguna Xs.2 medium	Poolside	2	4.1	$0.015	6/19	6.73s
Jumla ya majaribio 19 Majaribio yenye makosa 13 Jumla ya gharama $0.015 Muda wa majibu (wastani) 6.73s

1 2 3 4 5

→

Kushindwa kwa Hakuna jibu

Chuja miundo

Modeli bora kwa Idadi ya Hakuna jibu

Idadi ya Hakuna jibu dhidi ya Alama

Modeli bora kwa Muda wa majibu (wastani)