नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 vs Laguna Xs.2

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-29

मेट्रिक GPT-5.4 GPT-5.4 none प्रकाशन: 2026-03-05 Laguna Xs.2 Laguna Xs.2 medium प्रकाशन: 2026-04-28 मोफत उपलब्ध
स्कोअर 5.9 6.2
क्रमांक #86 #81
विश्वसनीयता लागू नाही 10.0
सुसंगतता 9.1 6.9
बरोबर चाचण्या
प्रति प्रयत्न पास दर 42.6% 57.4%
अस्थिर चाचण्या 2 7
एकूण रन 54 54
प्रति निकाल खर्च 1.477 0.000
एकूण खर्च $0.104 $0.000
???? ??? $2.500 / 1M $0.000 / 1M
????? ??? $15.000 / 1M $0.000 / 1M
आउटपुट टोकन्स 2,317 58,141
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 1.51s 6.03s
प्रतिसाद वेळ (कमाल) 2.95s 29.11s
प्रतिसाद वेळ (एकूण) 27.21s 108.59s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 3.2 8.0 8.3% 1 1.21s 406 0
Laguna Xs.2 7.4 5.9 83.3% 2 2.60s 5,283 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 2.95s 480 0
Laguna Xs.2 6.3 3.7 33.3% 1 14.36s 7,896 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 3.0 10.0 0.0% 0 2.89s 291 0
Laguna Xs.2 3.0 10.0 0.0% 0 15.92s 8,501 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 1.04s 222 0
Laguna Xs.2 7.1 5.6 83.3% 1 9.34s 10,472 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 5.3 7.2 44.4% 1 1.07s 50 0
Laguna Xs.2 4.1 4.4 44.5% 2 11.12s 18,712 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 4.4 9.9 0.0% 0 1.78s 184 0
Laguna Xs.2 4.1 10.0 0.0% 0 2.76s 1,421 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 6.5 10.0 50.0% 0 1.07s 81 0
Laguna Xs.2 10.0 10.0 100.0% 0 1.68s 1,517 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 5.6 9.8 33.3% 0 1.52s 357 0
Laguna Xs.2 5.3 10.0 33.3% 0 2.12s 3,168 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Laguna Xs.2 4.7 1.6 66.7% 1 3.39s 1,171 0

झटपट तुलना

तुलना जोडी बदला