नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: gpt-oss-120b vs Laguna M.1

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-29

मेट्रिक gpt-oss-120b gpt-oss-120b medium रिलीज़: 2025-08-05 निःशुल्क उपलब्ध Laguna M.1 Laguna M.1 none रिलीज़: 2026-04-28 निःशुल्क उपलब्ध
स्कोर 5.8 5.1
रैंक #88 #117
विश्वसनीयता लागू नहीं 9.9
संगति 7.2 8.7
सही परीक्षण
प्रति प्रयास पास दर 51.9% 33.3%
अस्थिर टेस्ट 6 3
कुल रन 54 54
प्रति परिणाम लागत 0.144 0.000
कुल लागत $0.011 $0.000
???? ??? $0.000 / 1M $0.000 / 1M
????? ??? $0.000 / 1M $0.000 / 1M
आउटपुट टोकन 13,493 2,870
रीजनिंग टोकन 36,879 0
प्रतिक्रिया समय (औसत) 16.08s 2.79s
प्रतिक्रिया समय (अधिकतम) 50.92s 15.42s
प्रतिक्रिया समय (कुल) 176.88s 50.24s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 3,518 2,177
Laguna M.1 3.4 7.9 16.7% 1 1.23s 485 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.3 1.1 66.7% 1 26.33s 228 2,549
Laguna M.1 7.5 3.8 66.7% 1 2.93s 543 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
Laguna M.1 3.0 10.0 0.0% 0 4.32s 622 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 241 1,114
Laguna M.1 10.0 10.0 100.0% 0 3.37s 246 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 6,784 20,606
Laguna M.1 3.6 7.2 22.2% 1 5.50s 33 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 107 387
Laguna M.1 4.0 10.0 0.0% 0 3.08s 212 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 126 1,799
Laguna M.1 6.3 10.0 50.0% 0 683ms 80 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.2 4.7 22.2% 2 11.80s 1,508 2,092
Laguna M.1 3.2 10.0 0.0% 0 951ms 340 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 287 1,083
Laguna M.1 10.0 10.0 100.0% 0 7.54s 309 0

त्वरित तुलना

तुलना जोड़ी बदलें