AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5.3-Codex

सारांश

Seed-2.0-Lite vs GPT-5.3-Codex benchmark तुलना: GPT-5.3-Codex average score में आगे है: 8.4 vs 8.2. Seed-2.0-Lite की benchmark लागत कम है: $0.175 vs $0.740. GPT-5.3-Codex तेज है: 16.22s vs 47.07s, pass rates 76.2% vs 82.5%.

अनुशंसित मॉडल: Seed-2.0-Lite - Its score stays close to the best score here (8.2 vs 8.4), while costing about 4.2x less than GPT-5.3-Codex.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-10

मेट्रिक	Seed-2.0-Lite Seed-2.0-Lite medium रिलीज़: 2026-02-14	GPT-5.3-Codex GPT-5.3-Codex medium रिलीज़: 2026-02-05

मेट्रिक	Seed-2.0-Lite Seed-2.0-Lite medium रिलीज़: 2026-02-14	GPT-5.3-Codex GPT-5.3-Codex medium रिलीज़: 2026-02-05
स्कोर	8.2	8.4
रैंक	#20	#16
विश्वसनीयता	10.0	10.0
संगति	9.0	8.5
सही परीक्षण
प्रति प्रयास पास दर	76.2%	82.5%
अस्थिर टेस्ट	3	4
कुल रन	63	63
प्रति परिणाम लागत	1.250	4.932
कुल लागत	$0.175	$0.740
इनपुट कीमत	$0.250 / 1M	$1.750 / 1M
आउटपुट कीमत	$2.000 / 1M	$14.000 / 1M
कुल इनपुट टोकन	46,740	34,299
आउटपुट टोकन	3,230	2,357
रीजनिंग टोकन	78,406	46,189
प्रतिक्रिया समय (औसत)	47.07s	16.22s
प्रतिक्रिया समय (अधिकतम)	254.92s	100.93s
प्रतिक्रिया समय (कुल)	988.37s	340.67s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#20 Seed-2.0-Lite

medium

Cost: $0.005
Time: 86.7s
Tokens: 2,354 tok

#16 GPT-5.3-Codex

medium

Cost: $0.049
Time: 54.9s
Tokens: 3,580 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	942	996	7,142
GPT-5.3-Codex	8.7	7.9	91.7%	1		4.16s	606	240	1,722

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	8.0	9.8	66.7%	0		156.74s	8,247	458	31,890
GPT-5.3-Codex	10.0	10.0	100.0%	0		19.50s	7,302	535	10,890

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	16,254	506	4,299
GPT-5.3-Codex	10.0	10.0	100.0%	0		19.56s	11,019	364	2,731

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	8,562	246	1,742
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.07s	7,140	234	728

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	843	15	23,897
GPT-5.3-Codex	5.9	7.2	55.6%	1		64.31s	813	64	25,308

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	582	304	1,620
GPT-5.3-Codex	4.6	10.0	0.0%	0		4.87s	477	187	331

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	834	71	1,480
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.04s	660	93	693

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	9.0	7.9	88.9%	1		10.23s	894	403	3,285
GPT-5.3-Codex	9.0	7.9	88.9%	1		5.05s	642	356	1,593

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	9,306	222	1,011
GPT-5.3-Codex	10.0	10.0	100.0%	0		6.37s	5,445	254	492

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	3.0	10.0	0.0%	0		48.32s	276	9	2,040
GPT-5.3-Codex	2.8	1.6	33.3%	1		14.43s	195	30	1,701

त्वरित तुलना

तुलना जोड़ी बदलें

Gemini 3 Flash PreviewlowvsGPT-5.3-Codexmedium Seed-2.0-LitemediumvsGemini 3.5 Flashnone Seed-2.0-LitemediumvsGPT-5.2 Chatnone Seed-2.0-LitemediumvsGemini 3 Flash Previewlow Gemini 3.5 FlashnonevsGPT-5.3-Codexmedium Seed-2.0-LitemediumvsDeepSeek V4 Flashhigh Seed-2.0-LitemediumvsGemini 3.5 Flashminimal Seed-2.0-LitemediumvsQwen3.7 Maxnone DeepSeek V4 FlashhighvsGPT-5.3-Codexmedium Gemini 3.5 FlashminimalvsGPT-5.3-Codexmedium GPT-5.3-CodexmediumvsQwen3.7 Maxnone Seed-2.0-LitemediumvsGemini 3 Flash Previewnone