नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Laguna M.1

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-29

मेट्रिक GPT-5.4 GPT-5.4 none रिलीज़: 2026-03-05 Laguna M.1 Laguna M.1 medium रिलीज़: 2026-04-28 निःशुल्क उपलब्ध
स्कोर 5.9 6.3
रैंक #86 #73
विश्वसनीयता लागू नहीं 10.0
संगति 9.1 8.6
सही परीक्षण
प्रति प्रयास पास दर 42.6% 53.7%
अस्थिर टेस्ट 2 3
कुल रन 54 54
प्रति परिणाम लागत 1.477 0.000
कुल लागत $0.104 $0.000
???? ??? $2.500 / 1M $0.000 / 1M
????? ??? $15.000 / 1M $0.000 / 1M
आउटपुट टोकन 2,317 63,822
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.51s 13.90s
प्रतिक्रिया समय (अधिकतम) 2.95s 53.14s
प्रतिक्रिया समय (कुल) 27.21s 250.28s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.2 8.0 8.3% 1 1.21s 406 0
Laguna M.1 6.6 10.0 50.0% 0 9.15s 7,839 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 2.95s 480 0
Laguna M.1 4.3 1.1 66.7% 1 35.61s 14,327 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.0 10.0 0.0% 0 2.89s 291 0
Laguna M.1 3.0 10.0 0.0% 0 53.14s 12,272 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 1.04s 222 0
Laguna M.1 10.0 10.0 100.0% 0 4.93s 2,296 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.3 7.2 44.4% 1 1.07s 50 0
Laguna M.1 5.3 7.2 44.4% 1 24.14s 19,020 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 4.4 9.9 0.0% 0 1.78s 184 0
Laguna M.1 4.1 10.0 0.0% 0 6.86s 1,294 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 6.5 10.0 50.0% 0 1.07s 81 0
Laguna M.1 10.0 10.0 100.0% 0 4.30s 1,626 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.6 9.8 33.3% 0 1.52s 357 0
Laguna M.1 3.6 7.2 22.2% 1 6.97s 3,978 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Laguna M.1 10.0 10.0 100.0% 0 6.31s 1,170 0

त्वरित तुलना

तुलना जोड़ी बदलें