नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Mistral: Mistral Small 4 vs OpenAI: gpt-oss-120b

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-22

मेट्रिक Mistral Small 4 Mistral Small 4 medium रिलीज़: 2026-03-16 gpt-oss-120b gpt-oss-120b none रिलीज़: 2025-08-05 निःशुल्क उपलब्ध
स्कोर 5.4 5.2
रैंक #121 #129
विश्वसनीयता 10.0 10.0
संगति 7.1 8.7
सही परीक्षण
प्रति प्रयास पास दर 45.0% 36.8%
अस्थिर टेस्ट 7 3
कुल रन 60 57
प्रति परिणाम लागत 1.109 0.201
कुल लागत $0.056 $0.011
???? ??? $0.150 / 1M $0.000 / 1M
????? ??? $0.600 / 1M $0.000 / 1M
आउटपुट टोकन 21,628 51,505
रीजनिंग टोकन 68,055 0
प्रतिक्रिया समय (औसत) 8.33s 21.86s
प्रतिक्रिया समय (अधिकतम) 59.15s 113.71s
प्रतिक्रिया समय (कुल) 166.59s 349.78s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 4,055 4,778
gpt-oss-120b 6.5 10.0 50.0% 0 32.84s 8,676 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.1 6.8 33.3% 1 44.82s 9,322 38,386
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 2,612 10,700
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 335 723
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 2,621 6,904
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 821 828
gpt-oss-120b 4.8 10.0 0.0% 0 10.79s 615 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 540 1,031
gpt-oss-120b 9.8 10.0 100.0% 0 5.10s 1,982 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.4 9.7 0.0% 0 2.00s 983 2,338
gpt-oss-120b 4.4 4.5 44.5% 2 9.51s 3,781 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 321 810
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.0 10.0 0.0% 0 5.92s 18 1,557
gpt-oss-120b 3.0 10.0 0.0% 0 47.29s 3,138 0

त्वरित तुलना

तुलना जोड़ी बदलें