AI BENCHY Compare

inclusionAI: Ring-2.6-1T vs Tencent: Hy3 preview

Last updated at: 2026-05-22

Metric	Ring-2.6-1T Ring-2.6-1T medium Release: 2026-05-10	Hy3 preview Hy3 preview low Release: 2026-04-22

Metric	Ring-2.6-1T Ring-2.6-1T medium Release: 2026-05-10	Hy3 preview Hy3 preview low Release: 2026-04-22
Score	7.2	7.7
Rank	#61	#37
Reliability	9.9	10.0
Consistency	8.7	9.5
Tests Correct
Attempt pass rate	66.7%	72.9%
Flaky tests	3	1
Total Runs	60	60
Cost per result	0.000	0.000
Total Cost	$0.000	$0.000
Input Price	$0.075 / 1M	$0.066 / 1M
Output Price	$0.625 / 1M	$0.260 / 1M
Output Tokens	21,752	63,155
Reasoning Tokens	42,754	0
Response Time (avg)	61.29s	24.58s
Response Time (max)	304.19s	78.74s
Response Time (total)	1164.50s	368.71s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Ring-2.6-1T	10.0	10.0	100.0%	0		42.21s	3,833	4,891
Hy3 preview	10.0	10.0	100.0%	0		9.32s	2,954	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Ring-2.6-1T	10.0	10.0	100.0%	0		59.65s	1,369	3,985
Hy3 preview	10.0	10.0	100.0%	0		27.94s	7,907	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Ring-2.6-1T	10.0	10.0	100.0%	0		304.19s	324	6,088
Hy3 preview	10.0	10.0	100.0%	0		78.74s	12,975	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Ring-2.6-1T	6.5	10.0	50.0%	0		37.36s	840	1,937
Hy3 preview	6.5	10.0	50.0%	0		5.85s	1,022	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Ring-2.6-1T	3.5	4.4	33.3%	2		64.92s	9,744	15,013
Hy3 preview	5.9	7.2	55.6%	1		40.44s	23,121	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Ring-2.6-1T	4.1	10.0	0.0%	0		58.26s	150	583
Hy3 preview	0.0	0.0	0.0%	0		0ms	0	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Ring-2.6-1T	9.8	10.0	100.0%	0		11.78s	266	1,831
Hy3 preview	10.0	10.0	100.0%	0		15.98s	2,475	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Ring-2.6-1T	5.9	7.2	55.6%	1		20.73s	697	2,479
Hy3 preview	6.5	10.0	50.0%	0		7.69s	3,637	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Ring-2.6-1T	10.0	10.0	100.0%	0		104.44s	234	1,531
Hy3 preview	6.6	10.0	100.0%	0		17.84s	1,203	0

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Ring-2.6-1T	3.0	10.0	0.0%	0		113.91s	4,295	4,416
Hy3 preview	3.0	10.0	0.0%	0		41.74s	7,861	0

Quick Compare

Switch Comparison Pair

Ring-2.6-1TmediumvsQwen3.6 Max Previewnone DeepSeek V4 FlashhighFree AvailablevsRing-2.6-1Tmedium Ring-2.6-1TmediumvsGPT-5.3 Chatnone Gemini 3.1 Flash LitelowvsRing-2.6-1Tmedium Claude Sonnet 4.6nonevsRing-2.6-1Tmedium Gemini 3.1 Flash Lite PreviewnonevsRing-2.6-1Tmedium Ring-2.6-1TmediumvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewlowvsRing-2.6-1Tmedium Gemini 3 Flash PreviewnonevsRing-2.6-1Tmedium Gemma 4 31BnoneFree AvailablevsRing-2.6-1Tmedium Gemini 3.1 Flash LiteminimalvsRing-2.6-1Tmedium DeepSeek V4 ProhighvsRing-2.6-1Tmedium