नेविगेशन
AI BENCHY
तुलना करें चार्ट Karyapranali
❤️ Made by XCS
Your ad here

AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Mini vs OpenAI: GPT-5.2 Chat

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-06

मेट्रिक ByteDance Seed: Seed-2.0-Mini medium रिलीज़: 2026-02-14 OpenAI: GPT-5.2 Chat none रिलीज़: 2025-12-11
रैंक #23 #15
औसत स्कोर 6.9 7.4
संगति 9.1 9.1
प्रति परिणाम लागत 0.280 2.440
कुल लागत $0.028 $0.269
सही परीक्षण
प्रति प्रयास पास दर 68.8% 75.0%
अस्थिर टेस्ट 2 2
common.totalRuns 48 (16 x 3) 48 (16 x 3)
आउटपुट टोकन 1,965 15,845
रीजनिंग टोकन 58,456 0
प्रतिक्रिया समय (औसत) 65.09s 7.03s
प्रतिक्रिया समय (अधिकतम) 262.83s 38.52s
प्रतिक्रिया समय (कुल) 846.14s 112.51s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
ByteDance Seed: Seed-2.0-Mini 7.0 10.0 66.7% 0 98.99s 354 9,352
OpenAI: GPT-5.2 Chat 10.0 10.0 100.0% 0 3.97s 1,651 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
ByteDance Seed: Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
OpenAI: GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
ByteDance Seed: Seed-2.0-Mini 9.9 10.0 100.0% 0 24.27s 246 2,743
OpenAI: GPT-5.2 Chat 9.9 10.0 100.0% 0 3.05s 980 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
ByteDance Seed: Seed-2.0-Mini 10.0 10.0 0.0% 0 0ms 0 0
OpenAI: GPT-5.2 Chat 4.0 10.0 33.3% 0 17.78s 7,810 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
ByteDance Seed: Seed-2.0-Mini 6.0 3.4 33.3% 1 36.65s 213 4,210
OpenAI: GPT-5.2 Chat 4.0 3.0 33.3% 1 3.20s 335 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
ByteDance Seed: Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
OpenAI: GPT-5.2 Chat 6.0 6.1 83.3% 1 5.46s 1,528 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
ByteDance Seed: Seed-2.0-Mini 7.0 7.2 88.9% 1 25.85s 457 5,060
OpenAI: GPT-5.2 Chat 7.0 10.0 66.7% 0 4.42s 1,743 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
ByteDance Seed: Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
OpenAI: GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0

त्वरित तुलना

तुलना जोड़ी बदलें