AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5.2

सारांश

Seed-2.0-Lite vs GPT-5.2 benchmark तुलना: Seed-2.0-Lite average score में आगे है: 8.5 vs 8.4. Seed-2.0-Lite की benchmark लागत कम है: $0.175 vs $0.548. GPT-5.2 तेज है: 16.88s vs 47.07s, pass rates 76.2% vs 71.4%.

अनुशंसित मॉडल: Seed-2.0-Lite - It has the best score here (8.5), while costing about 3.1x less than GPT-5.2.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक	Seed-2.0-Lite Seed-2.0-Lite medium रिलीज़: 2026-02-14	GPT-5.2 GPT-5.2 medium रिलीज़: 2025-12-11

मेट्रिक	Seed-2.0-Lite Seed-2.0-Lite medium रिलीज़: 2026-02-14	GPT-5.2 GPT-5.2 medium रिलीज़: 2025-12-11
स्कोर	8.5	8.4
रैंक	#18	#22
विश्वसनीयता	10.0	10.0
संगति	9.0	8.4
सही परीक्षण
प्रति प्रयास पास दर	76.2%	71.4%
अस्थिर टेस्ट	3	4
कुल रन	63	63
प्रति परिणाम लागत	1.250	4.209
कुल लागत	$0.175	$0.548
इनपुट कीमत	$0.250 / 1M	$1.750 / 1M
आउटपुट कीमत	$2.000 / 1M	$14.000 / 1M
कुल इनपुट टोकन	46,740	33,967
आउटपुट टोकन	3,230	2,901
रीजनिंग टोकन	78,406	31,932
प्रतिक्रिया समय (औसत)	47.07s	16.88s
प्रतिक्रिया समय (अधिकतम)	254.92s	77.80s
प्रतिक्रिया समय (कुल)	988.37s	236.34s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#18 Seed-2.0-Lite

medium

लागत: $0.005
समय: 86.7s
टोकन: 2,354 tok

#22 GPT-5.2

medium

लागत: $0.047
समय: 49.2s
टोकन: 3,396 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	942	996	7,142
GPT-5.2	6.5	8.0	58.3%	1		7.81s	606	567	2,002

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	8.0	9.8	66.7%	0		156.74s	8,247	458	31,890
GPT-5.2	10.0	10.0	100.0%	0		22.73s	7,302	511	11,912

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	16,254	506	4,299
GPT-5.2	10.0	10.0	100.0%	0		14.06s	11,019	291	1,757

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	8,562	246	1,742
GPT-5.2	10.0	10.0	100.0%	0		3.15s	7,140	234	420

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	843	15	23,897
GPT-5.2	5.9	7.2	55.6%	1		77.80s	473	42	10,342

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	582	304	1,620
GPT-5.2	3.7	9.7	0.0%	0		4.32s	477	162	269

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	834	71	1,480
GPT-5.2	9.9	10.0	100.0%	0		3.12s	660	94	614

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	9.0	7.9	88.9%	1		10.23s	894	403	3,285
GPT-5.2	7.5	7.3	77.8%	1		5.80s	642	735	924

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	9,306	222	1,011
GPT-5.2	4.7	1.6	66.7%	1		10.30s	5,453	239	469

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Seed-2.0-Lite	3.0	10.0	0.0%	0		48.32s	276	9	2,040
GPT-5.2	3.0	10.0	0.0%	0		28.18s	195	26	3,223

त्वरित तुलना

तुलना जोड़ी बदलें

Seed-2.0-LitemediumvsGPT-5.2 Chatnone DeepSeek V4 FlashhighvsGPT-5.2medium Seed-2.0-LitemediumvsDeepSeek V4 Flashhigh Claude Opus 4.8lowvsGPT-5.2medium GPT-5.2mediumvsStep 3.7 Flashlow Claude Opus 4.8lowvsSeed-2.0-Litemedium Seed-2.0-LitemediumvsGemini 3.5 Flashlow DeepSeek V4 ProhighvsGPT-5.2medium Seed-2.0-LitemediumvsStep 3.7 Flashlow Seed-2.0-LitemediumvsGPT-5.5low Gemini 3.5 FlashlowvsGPT-5.2medium Seed-2.0-LitemediumvsDeepSeek V4 Prohigh