नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: gpt-oss-120b vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-11

मेट्रिक gpt-oss-120b gpt-oss-120b none रिलीज़: 2025-08-05 निःशुल्क उपलब्ध Grok 4.20 Grok 4.20 medium रिलीज़: 2026-03-31
स्कोर 5.2 7.0
रैंक #79 #44
संगति 7.9 7.8
सही परीक्षण
प्रति प्रयास पास दर 38.9% 66.7%
अस्थिर टेस्ट 5 5
कुल रन 54 54
प्रति परिणाम लागत 0.221 8.252
कुल लागत $0.009 $0.743
???? ??? $0.039 / 1M $2.000 / 1M
????? ??? $0.190 / 1M $6.000 / 1M
आउटपुट टोकन 44,652 1,744
रीजनिंग टोकन 0 109,882
प्रतिक्रिया समय (औसत) 11.96s 10.33s
प्रतिक्रिया समय (अधिकतम) 68.97s 29.87s
प्रतिक्रिया समय (कुल) 179.34s 185.87s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.6 8.0 58.3% 1 6.03s 4,867 0
Grok 4.20 8.2 7.9 83.3% 1 3.36s 280 8,476
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
Grok 4.20 4.3 1.1 66.7% 1 24.33s 250 12,804
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.6 10.0 0.0% 0 2.83s 586 0
Grok 4.20 5.8 2.8 66.7% 1 7.09s 47 4,252
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 8.4 6.9 83.3% 1 5.10s 1,982 0
Grok 4.20 7.3 5.9 83.3% 1 4.42s 40 5,474
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.5 4.8 44.5% 2 6.86s 3,904 0
Grok 4.20 6.4 7.7 55.6% 1 3.89s 143 8,028
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620

त्वरित तुलना

तुलना जोड़ी बदलें