तुलना करें चार्ट

भाषा:

❤️ Made by XCS

AI BENCHY तुलना

Anthropic: Claude Sonnet 4.6 vs Google: Gemini 3.1 Flash Lite Preview

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-03

मेट्रिक	Anthropic: Claude Sonnet 4.6 medium रिलीज़: 2026-02-17	Google: Gemini 3.1 Flash Lite Preview none रिलीज़: 2026-03-03
रैंक	#11	#10
औसत स्कोर	7.43	7.70
संगति	9.40	9.54
प्रति परिणाम लागत	8.105	0.116
कुल लागत	$0.811	$0.011
सही परीक्षण
प्रति प्रयास पास दर	73.8%	69.1%
अस्थिर टेस्ट	1	1
आउटपुट टोकन	29,098	4,307
रीजनिंग टोकन	20,435	0

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	आउटपुट टोकन	रीजनिंग टोकन
Anthropic: Claude Sonnet 4.6	7.00	10.00	66.7%	0		1,031	1,093
Google: Gemini 3.1 Flash Lite Preview	6.00	7.85	55.6%	1		1,086	0

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	आउटपुट टोकन	रीजनिंग टोकन
Anthropic: Claude Sonnet 4.6	10.00	10.00	100.0%	0		727	907
Google: Gemini 3.1 Flash Lite Preview	9.88	10.00	100.0%	0		399	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	आउटपुट टोकन	रीजनिंग टोकन
Anthropic: Claude Sonnet 4.6	1.00	7.21	11.1%	1		25,790	16,919
Google: Gemini 3.1 Flash Lite Preview	4.00	10.00	33.3%	0		568	0

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	आउटपुट टोकन	रीजनिंग टोकन
Anthropic: Claude Sonnet 4.6	10.00	10.00	100.0%	0		316	523
Google: Gemini 3.1 Flash Lite Preview	9.00	10.00	50.0%	0		574	0

Puzzle Solving	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	आउटपुट टोकन	रीजनिंग टोकन
Anthropic: Claude Sonnet 4.6	10.00	10.00	100.0%	0		579	642
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		898	0

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	आउटपुट टोकन	रीजनिंग टोकन
Anthropic: Claude Sonnet 4.6	10.00	10.00	100.0%	0		655	351
Google: Gemini 3.1 Flash Lite Preview	10.00	10.00	100.0%	0		782	0

त्वरित तुलना

तुलना जोड़ी बदलें

Claude Sonnet 4.6mediumvsGPT-5.2 Chatnone Claude Sonnet 4.6mediumvsGPT-5.3 Chatnone Claude Sonnet 4.6mediumvsGemini 3 Flash Previewnone Gemini 3.1 Flash Lite PreviewnonevsGPT-5.3-Codexmedium Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewhigh Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewlow Gemini 3.1 Flash Lite PreviewnonevsGLM 5medium Gemini 3.1 Flash Lite PreviewnonevsStep 3.5 Flashmediumनिःशुल्क उपलब्ध DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewnonevsGPT-5.2medium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-27Bmedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-122B-A10Bmedium