Linganisha Chati Mbinu

Lugha:

❤️ Made by XCS

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs OpenAI: GPT-5.2 Chat

Linganisha:

Benchmark zimetengenezwa kutoka seti za majaribio za AI BENCHY tarehe: 2026-03-06

Kipimo	Anthropic: Claude Opus 4.6 medium Toleo: 2026-02-05	OpenAI: GPT-5.2 Chat none Toleo: 2025-12-11
Wastani wa alama	6.4	7.7
Nafasi	#30	#11
Majaribio sahihi
Uthabiti	8.9	9.5
Gharama kwa matokeo	14.411	2.389
Jumla ya gharama	$1.297	$0.263
Kiwango cha kupita kwa kila jaribio	64.4%	77.8%
Majaribio yasiyo thabiti	2	1
common.totalRuns	45 (15 x 3)	45 (15 x 3)
Tokeni za matokeo	26,066	15,510
Tokeni za hoja	17,071	0
Muda wa majibu (wastani)	25.08s	7.29s
Muda wa majibu (upeo)	83.40s	38.52s
Muda wa majibu (jumla)	200.67s	109.31s

Modeli bora kwa alama

Alama dhidi ya gharama ya jumla

Muda wa majibu (wastani)

Wastani wa alama vs Muda wa majibu (wastani)

Mgawanyo wa kategoria

Mbinu za kupinga AI	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za matokeo	Tokeni za hoja
Anthropic: Claude Opus 4.6	4.0	4.4	55.6%	2		11.88s	897	1,000
OpenAI: GPT-5.2 Chat	10.0	10.0	100.0%	0		3.97s	1,651	0

Mchanganyiko	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za matokeo	Tokeni za hoja
Anthropic: Claude Opus 4.6	10.0	10.0	100.0%	0		76.66s	8,178	5,194
OpenAI: GPT-5.2 Chat	10.0	10.0	100.0%	0		9.12s	1,243	0

Uchanganuzi na uchimbaji wa data	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za matokeo	Tokeni za hoja
Anthropic: Claude Opus 4.6	9.9	10.0	100.0%	0		7.37s	691	757
OpenAI: GPT-5.2 Chat	9.9	10.0	100.0%	0		3.05s	980	0

Mahususi kwa domeni	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za matokeo	Tokeni za hoja
Anthropic: Claude Opus 4.6	10.0	10.0	0.0%	0		83.40s	14,642	8,687
OpenAI: GPT-5.2 Chat	4.0	10.0	33.3%	0		17.78s	7,810	0

Ufuataji wa maagizo	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za matokeo	Tokeni za hoja
Anthropic: Claude Opus 4.6	10.0	10.0	100.0%	0		2.43s	266	467
OpenAI: GPT-5.2 Chat	6.0	6.1	83.3%	1		5.46s	1,528	0

Puzzle Solving	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za matokeo	Tokeni za hoja
Anthropic: Claude Opus 4.6	7.0	10.0	66.7%	0		4.60s	531	637
OpenAI: GPT-5.2 Chat	7.0	10.0	66.7%	0		4.42s	1,743	0

Mwito wa zana	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za matokeo	Tokeni za hoja
Anthropic: Claude Opus 4.6	10.0	10.0	100.0%	0		9.73s	861	329
OpenAI: GPT-5.2 Chat	10.0	10.0	100.0%	0		4.68s	555	0

Ulinganisho wa haraka

Badilisha jozi ya ulinganisho

Claude Opus 4.6mediumvsQwen3.5 Plus 2026-02-15none Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2 Chatnone DeepSeek V3.2mediumvsGPT-5.2 Chatnone Gemini 2.5 FlashmediumvsGPT-5.2 Chatnone Claude Sonnet 4.6mediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsStep 3.5 FlashmediumInapatikana bure GPT-5.2 ChatnonevsMiMo-V2-Flashmedium GPT-5.2 ChatnonevsGLM 5medium Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewhighvsGPT-5.2 Chatnone Gemini 3 Pro PreviewmediumvsGPT-5.2 Chatnone Gemini 3 Flash PreviewlowvsGPT-5.2 Chatnone