तुलना करें चार्ट

भाषा:

❤️ Made by XCS

AI BENCHY तुलना

Google: Gemini 3.1 Pro Preview vs OpenAI: GPT-5.4

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-05

मेट्रिक	Google: Gemini 3.1 Pro Preview medium रिलीज़: 2026-02-19	OpenAI: GPT-5.4 none रिलीज़: 2026-03-05
रैंक	#2	#44
औसत स्कोर	9.3	4.6
सही परीक्षण
संगति	10.0	8.9
प्रति परिणाम लागत	3.544	1.496
कुल लागत	$0.497	$0.090
प्रति प्रयास पास दर	93.3%	44.4%
अस्थिर टेस्ट	0	2
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
आउटपुट टोकन	1,413	1,635
रीजनिंग टोकन	34,477	0
प्रतिक्रिया समय (औसत)	17.20s	1.46s
प्रतिक्रिया समय (अधिकतम)	40.61s	2.89s
प्रतिक्रिया समय (कुल)	137.59s	21.86s

स्कोर के अनुसार शीर्ष मॉडल

प्रतिक्रिया समय (औसत)

स्कोर बनाम कुल लागत

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Google: Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.52s	106	2,533
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Google: Gemini 3.1 Pro Preview	9.0	10.0	100.0%	0		40.61s	432	9,281
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Google: Gemini 3.1 Pro Preview	9.9	10.0	100.0%	0		7.72s	279	3,904
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Google: Gemini 3.1 Pro Preview	7.0	10.0	66.7%	0		32.73s	18	12,424
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Google: Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0

Puzzle Solving	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Google: Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Google: Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0

त्वरित तुलना

तुलना जोड़ी बदलें

MiniMax M2.5mediumvsGPT-5.4none Mercury 2mediumvsGPT-5.4none GPT-5.4nonevsQwen3.5-35B-A3Bmedium GPT-5.4nonevsQwen3 Coder Nextmedium GPT-5.4nonevsGLM 4.7 Flashmedium Gemini 3.1 Pro PreviewmediumvsGPT-5.2 Chatnone Claude Opus 4.6mediumvsGPT-5.4none Kimi K2.5mediumvsGPT-5.4none GPT-5.4nonevsGrok 4.1 Fastmedium Gemini 3.1 Pro PreviewmediumvsGPT-5.3 Chatnone GPT-5.4nonevsQwen3.5-Flashmedium Seed-2.0-MinimediumvsGPT-5.4none