तुलना करें चार्ट

भाषा:

❤️ Made by XCS

AI BENCHY तुलना

Inception: Mercury 2 vs xAI: Grok 4.1 Fast

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-05

मेट्रिक	Inception: Mercury 2 none रिलीज़: 2026-02-24	xAI: Grok 4.1 Fast medium रिलीज़: 2025-11-19
रैंक	#50	#28
औसत स्कोर	3.4	6.4
सही परीक्षण
संगति	8.9	7.8
प्रति परिणाम लागत	0.147	0.541
कुल लागत	$0.006	$0.049
प्रति प्रयास पास दर	33.3%	71.1%
अस्थिर टेस्ट	2	4
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
आउटपुट टोकन	1,144	1,056
रीजनिंग टोकन	0	80,419
प्रतिक्रिया समय (औसत)	594ms	27.61s
प्रतिक्रिया समय (अधिकतम)	1.27s	121.79s
प्रतिक्रिया समय (कुल)	8.91s	220.87s

स्कोर के अनुसार शीर्ष मॉडल

प्रतिक्रिया समय (औसत)

स्कोर बनाम कुल लागत

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Inception: Mercury 2	10.0	10.0	0.0%	0		466ms	274	0
xAI: Grok 4.1 Fast	10.0	10.0	100.0%	0		5.65s	102	4,021

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Inception: Mercury 2	10.0	10.0	0.0%	0		606ms	131	0
xAI: Grok 4.1 Fast	10.0	10.0	100.0%	0		37.64s	261	12,272

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Inception: Mercury 2	5.5	5.9	83.3%	1		667ms	180	0
xAI: Grok 4.1 Fast	9.9	10.0	100.0%	0		6.63s	180	5,409

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Inception: Mercury 2	4.0	7.2	44.4%	1		534ms	46	0
xAI: Grok 4.1 Fast	4.0	4.4	66.7%	2		121.79s	11	37,657

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Inception: Mercury 2	5.5	10.0	50.0%	0		551ms	82	0
xAI: Grok 4.1 Fast	5.5	10.0	50.0%	0		5.30s	55	3,489

Puzzle Solving	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Inception: Mercury 2	10.0	10.0	0.0%	0		533ms	234	0
xAI: Grok 4.1 Fast	4.0	7.2	44.4%	1		8.08s	187	6,086

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Inception: Mercury 2	10.0	10.0	100.0%	0		1.27s	197	0
xAI: Grok 4.1 Fast	10.0	1.6	33.3%	1		27.71s	260	11,485

त्वरित तुलना

तुलना जोड़ी बदलें

Qwen3.5 Plus 2026-02-15nonevsGrok 4.1 Fastmedium Mercury 2nonevsQwen3 Coder Nextmedium Mercury 2nonevsGLM 4.7 Flashmedium Claude Sonnet 4.6nonevsGrok 4.1 Fastmedium Gemini 3 Flash PreviewnonevsGrok 4.1 Fastmedium Grok 4.1 FastmediumvsGLM 5none Gemini 3.1 Flash Lite PreviewnonevsGrok 4.1 Fastmedium GPT-5.3 ChatnonevsGrok 4.1 Fastmedium Gemini 3.1 Flash Lite PreviewlowvsGrok 4.1 Fastmedium Gemini 2.5 FlashnonevsGrok 4.1 Fastmedium DeepSeek V3.2nonevsGrok 4.1 Fastmedium GPT-5.2 ChatnonevsGrok 4.1 Fastmedium