नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Laguna Xs.2

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-29

मेट्रिक GPT-5.4 GPT-5.4 none रिलीज़: 2026-03-05 Laguna Xs.2 Laguna Xs.2 medium रिलीज़: 2026-04-28 निःशुल्क उपलब्ध
स्कोर 5.9 6.2
रैंक #86 #81
विश्वसनीयता लागू नहीं 10.0
संगति 9.1 6.9
सही परीक्षण
प्रति प्रयास पास दर 42.6% 57.4%
अस्थिर टेस्ट 2 7
कुल रन 54 54
प्रति परिणाम लागत 1.477 0.000
कुल लागत $0.104 $0.000
???? ??? $2.500 / 1M $0.000 / 1M
????? ??? $15.000 / 1M $0.000 / 1M
आउटपुट टोकन 2,317 58,141
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.51s 6.03s
प्रतिक्रिया समय (अधिकतम) 2.95s 29.11s
प्रतिक्रिया समय (कुल) 27.21s 108.59s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.2 8.0 8.3% 1 1.21s 406 0
Laguna Xs.2 7.4 5.9 83.3% 2 2.60s 5,283 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 2.95s 480 0
Laguna Xs.2 6.3 3.7 33.3% 1 14.36s 7,896 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.0 10.0 0.0% 0 2.89s 291 0
Laguna Xs.2 3.0 10.0 0.0% 0 15.92s 8,501 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 1.04s 222 0
Laguna Xs.2 7.1 5.6 83.3% 1 9.34s 10,472 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.3 7.2 44.4% 1 1.07s 50 0
Laguna Xs.2 4.1 4.4 44.5% 2 11.12s 18,712 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 4.4 9.9 0.0% 0 1.78s 184 0
Laguna Xs.2 4.1 10.0 0.0% 0 2.76s 1,421 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 6.5 10.0 50.0% 0 1.07s 81 0
Laguna Xs.2 10.0 10.0 100.0% 0 1.68s 1,517 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.6 9.8 33.3% 0 1.52s 357 0
Laguna Xs.2 5.3 10.0 33.3% 0 2.12s 3,168 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Laguna Xs.2 4.7 1.6 66.7% 1 3.39s 1,171 0

त्वरित तुलना

तुलना जोड़ी बदलें