नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-4o-mini vs Laguna Xs.2

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-29

मेट्रिक GPT-4o-mini GPT-4o-mini none रिलीज़: 2024-07-18 Laguna Xs.2 Laguna Xs.2 medium रिलीज़: 2026-04-28 निःशुल्क उपलब्ध
स्कोर 4.9 6.2
रैंक #119 #81
विश्वसनीयता लागू नहीं 10.0
संगति 9.9 6.9
सही परीक्षण
प्रति प्रयास पास दर 22.2% 57.4%
अस्थिर टेस्ट 0 7
कुल रन 54 54
प्रति परिणाम लागत 0.122 0.000
कुल लागत $0.005 $0.000
???? ??? $0.150 / 1M $0.000 / 1M
????? ??? $0.600 / 1M $0.000 / 1M
आउटपुट टोकन 1,947 58,141
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 2.00s 6.03s
प्रतिक्रिया समय (अधिकतम) 7.58s 29.11s
प्रतिक्रिया समय (कुल) 21.99s 108.59s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 4.8 10.0 25.0% 0 1.34s 186 0
Laguna Xs.2 7.4 5.9 83.3% 2 2.60s 5,283 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 3.0 8.7 0.0% 0 2.55s 347 0
Laguna Xs.2 6.3 3.7 33.3% 1 14.36s 7,896 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 3.0 10.0 0.0% 0 7.58s 568 0
Laguna Xs.2 3.0 10.0 0.0% 0 15.92s 8,501 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 10.0 10.0 100.0% 0 1.27s 183 0
Laguna Xs.2 7.1 5.6 83.3% 1 9.34s 10,472 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 3.0 10.0 0.0% 0 637ms 15 0
Laguna Xs.2 4.1 4.4 44.5% 2 11.12s 18,712 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 4.0 10.0 0.0% 0 909ms 66 0
Laguna Xs.2 4.1 10.0 0.0% 0 2.76s 1,421 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 4.8 10.0 0.0% 0 1.27s 69 0
Laguna Xs.2 10.0 10.0 100.0% 0 1.68s 1,517 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 3.7 10.0 0.0% 0 1.30s 308 0
Laguna Xs.2 5.3 10.0 33.3% 0 2.12s 3,168 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 10.0 10.0 100.0% 0 2.51s 205 0
Laguna Xs.2 4.7 1.6 66.7% 1 3.39s 1,171 0

त्वरित तुलना

तुलना जोड़ी बदलें