AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs inclusionAI: Ring-2.6-1T

Summary

Gemini 3.1 Flash Lite vs Ring-2.6-1T benchmark comparison: Ring-2.6-1T leads on average score with 6.8 vs 6.1. Gemini 3.1 Flash Lite has the lower benchmark cost at $0.013 vs $0.033. Gemini 3.1 Flash Lite is faster at 1.33s vs 61.29s, with pass rates of 54.0% vs 60.3%.

Recommended model: Gemini 3.1 Flash Lite - Its score stays close to the best score here (6.1 vs 6.8), while costing about 2.5x less than Ring-2.6-1T.

Last updated at: 2026-06-18

Metric	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Release: 2026-05-08	Ring-2.6-1T Ring-2.6-1T medium Release: 2026-05-10

Metric	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Release: 2026-05-08	Ring-2.6-1T Ring-2.6-1T medium Release: 2026-05-10
Score	6.1	6.8
Rank	#94	#72
Reliability	10.0	10.0
Consistency	8.8	8.8
Tests Correct
Attempt pass rate	54.0%	60.3%
Flaky tests	3	3
Total Runs	63	63
Cost per result	0.130	0.000
Total Cost	$0.013	$0.033
Input Price	$0.250 / 1M	$0.075 / 1M
Output Price	$1.500 / 1M	$0.625 / 1M
Total Input Tokens	36,973	35,892
Output Tokens	2,487	21,752
Reasoning Tokens	0	42,754
Response Time (avg)	1.33s	61.29s
Response Time (max)	4.49s	304.19s
Response Time (total)	27.91s	1164.50s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#94 Gemini 3.1 Flash Lite

minimal

Cost: $0.001
Time: 3.7s
Tokens: 635 tok

#72 Ring-2.6-1T

medium

Ring-2.6-1T is no longer available as a free model. It has transitioned to a paid model. Continue using it here: https://openrouter.ai/inclusionai/ring-2.6-1t

Cost: $0.000
Time: 0.1s
Tokens: 0 tok

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	8.3	10.0	75.0%	0		1.10s	500	639	0
Ring-2.6-1T	10.0	10.0	100.0%	0		42.21s	810	3,833	4,891

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	5.5	10.0	33.3%	0		831ms	8,126	666	0
Ring-2.6-1T	5.3	10.0	33.3%	0		59.65s	834	1,369	3,985

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		2.53s	12,870	357	0
Ring-2.6-1T	10.0	10.0	100.0%	0		304.19s	14,823	324	6,088

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.04s	7,552	279	0
Ring-2.6-1T	6.5	10.0	50.0%	0		37.36s	8,046	840	1,937

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		1.02s	641	15	0
Ring-2.6-1T	3.5	4.4	33.3%	2		64.92s	873	9,744	15,013

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	4.0	10.0	0.0%	0		791ms	490	63	0
Ring-2.6-1T	4.1	10.0	0.0%	0		58.26s	561	150	583

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		932ms	615	72	0
Ring-2.6-1T	9.8	10.0	100.0%	0		11.78s	774	266	1,831

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	6.0	4.6	66.7%	2		2.15s	564	153	0
Ring-2.6-1T	5.9	7.2	55.6%	1		20.73s	792	697	2,479

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		3.51s	5,457	234	0
Ring-2.6-1T	10.0	10.0	100.0%	0		104.44s	8,136	234	1,531

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		724ms	158	9	0
Ring-2.6-1T	3.0	10.0	0.0%	0		113.91s	243	4,295	4,416

Quick Compare

Switch Comparison Pair