नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.4 Mini vs Laguna Xs.2

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-01

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini none रिलीज़: 2026-03-17 Laguna Xs.2 Laguna Xs.2 medium रिलीज़: 2026-04-28 निःशुल्क उपलब्ध
स्कोर 5.1 6.2
रैंक #117 #81
विश्वसनीयता लागू नहीं 10.0
संगति 8.6 6.9
सही परीक्षण
प्रति प्रयास पास दर 35.2% 57.4%
अस्थिर टेस्ट 3 7
कुल रन 54 54
प्रति परिणाम लागत 0.630 0.000
कुल लागत $0.032 $0.000
???? ??? $0.750 / 1M $0.000 / 1M
????? ??? $4.500 / 1M $0.000 / 1M
आउटपुट टोकन 2,418 58,141
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.17s 6.03s
प्रतिक्रिया समय (अधिकतम) 2.52s 29.11s
प्रतिक्रिया समय (कुल) 21.01s 108.59s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
Laguna Xs.2 7.4 5.9 83.3% 2 2.60s 5,283 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.19s 333 0
Laguna Xs.2 6.3 3.7 33.3% 1 14.36s 7,896 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
Laguna Xs.2 3.0 10.0 0.0% 0 15.92s 8,501 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
Laguna Xs.2 7.1 5.6 83.3% 1 9.34s 10,472 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
Laguna Xs.2 4.1 4.4 44.5% 2 11.12s 18,712 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
Laguna Xs.2 4.1 10.0 0.0% 0 2.76s 1,421 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
Laguna Xs.2 10.0 10.0 100.0% 0 1.68s 1,517 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
Laguna Xs.2 5.3 10.0 33.3% 0 2.12s 3,168 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0
Laguna Xs.2 4.7 1.6 66.7% 1 3.39s 1,171 0

त्वरित तुलना

तुलना जोड़ी बदलें