Samanya Buddhimatta मॉडेल क्रमवारी

Samanya Buddhimatta मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा.

दाखवलेली मॉडेल्स

सरासरी Samanya Buddhimatta स्कोअर

6.1

सर्वोत्तम मॉडेल

Gemini 3 Flash Preview 10.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण सूचनांचे पालन केले नाही सह78 अयशस्वी होण्याचे कारण चुकीचे उत्तर सह55 अयशस्वी होण्याचे कारण API त्रुटी सह12 अयशस्वी होण्याचे कारण वेळ संपला सह4

206/206

क्रमांक	मॉडेल	कंपनी	Samanya Buddhimatta स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#1	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	1/1	5.19s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $0.742 प्रतिसाद वेळ (सरासरी) 5.19s
#2	Gemini 3.5 Flash high	Google	10.0	9.5	$1.976	1/1	3.63s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $1.976 प्रतिसाद वेळ (सरासरी) 3.63s
#3	GPT-5.6 Sol low	OpenAI	10.0	9.5	$0.971	1/1	3.07s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $0.971 प्रतिसाद वेळ (सरासरी) 3.07s
#4	GPT-5.6 Sol medium	OpenAI	10.0	9.4	$1.316	1/1	3.48s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $1.316 प्रतिसाद वेळ (सरासरी) 3.48s
#5	GPT-5.6 Sol high	OpenAI	10.0	9.4	$1.234	1/1	4.40s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $1.234 प्रतिसाद वेळ (सरासरी) 4.40s
#6	GPT-5.5 low	OpenAI	10.0	9.3	$1.253	1/1	5.17s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $1.253 प्रतिसाद वेळ (सरासरी) 5.17s
#7	Gemini 3.1 Pro Preview medium	Google	10.0	9.2	$1.361	1/1	11.8s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $1.361 प्रतिसाद वेळ (सरासरी) 11.8s
#8	Qwen3.7 Max medium	Qwen	10.0	9.2	$1.116	1/1	11.7s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $1.116 प्रतिसाद वेळ (सरासरी) 11.7s
#9	Gemini 3.5 Flash medium	Google	10.0	9.1	$0.642	1/1	2.52s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $0.642 प्रतिसाद वेळ (सरासरी) 2.52s
#10	GPT-5.5 medium	OpenAI	10.0	9.0	$4.137	1/1	4.16s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $4.137 प्रतिसाद वेळ (सरासरी) 4.16s
#11	Gemini 3.5 Flash low	Google	10.0	8.9	$0.433	1/1	2.27s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $0.433 प्रतिसाद वेळ (सरासरी) 2.27s
#14	Claude Opus 4.8 medium	Anthropic	10.0	8.8	$1.931	1/1	2.46s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $1.931 प्रतिसाद वेळ (सरासरी) 2.46s
#15	Claude Opus 4.7 medium	Anthropic	10.0	8.7	$1.477	1/1	2.87s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $1.477 प्रतिसाद वेळ (सरासरी) 2.87s
#16	Muse Spark 1.1 medium	Meta	10.0	8.6	$1.357	1/1	4.41s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $1.357 प्रतिसाद वेळ (सरासरी) 4.41s
#17	Claude Fable 5 medium	Anthropic	10.0	8.6	$3.478	1/1	7.42s
एकूण चाचण्या 1 चुकीच्या चाचण्या 0 एकूण खर्च $3.478 प्रतिसाद वेळ (सरासरी) 7.42s

1 2 14

→

Samanya Buddhimatta क्रमवारी

मॉडेल फिल्टर करा

Samanya Buddhimatta स्कोअर नुसार शीर्ष मॉडेल्स

Samanya Buddhimatta स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स