नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 Nano vs Laguna Xs.2

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-01

मेट्रिक GPT-5.4 Nano GPT-5.4 Nano none प्रकाशन: 2026-03-17 Laguna Xs.2 Laguna Xs.2 none प्रकाशन: 2026-04-28 मोफत उपलब्ध
स्कोअर 4.6 5.0
क्रमांक #127 #122
विश्वसनीयता लागू नाही 9.9
सुसंगतता 7.4 10.0
बरोबर चाचण्या
प्रति प्रयत्न पास दर 33.3% 27.8%
अस्थिर चाचण्या 6 0
एकूण रन 54 54
प्रति निकाल खर्च 0.299 0.000
एकूण खर्च $0.009 $0.000
???? ??? $0.200 / 1M $0.000 / 1M
????? ??? $1.250 / 1M $0.000 / 1M
आउटपुट टोकन्स 2,762 3,824
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 1.40s 1.68s
प्रतिसाद वेळ (कमाल) 3.84s 16.04s
प्रतिसाद वेळ (एकूण) 25.14s 30.26s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 3.5 8.0 16.7% 1 1.18s 800 0
Laguna Xs.2 3.2 10.0 0.0% 0 743ms 933 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 7.1 3.7 66.7% 1 1.43s 577 0
Laguna Xs.2 2.5 10.0 0.0% 0 1.96s 866 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 3.0 10.0 0.0% 0 3.84s 280 0
Laguna Xs.2 3.0 10.0 0.0% 0 2.01s 521 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 6.5 10.0 50.0% 0 1.11s 219 0
Laguna Xs.2 10.0 10.0 100.0% 0 646ms 246 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 2.9 4.4 22.2% 2 926ms 52 0
Laguna Xs.2 5.3 10.0 33.3% 0 371ms 33 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 3.8 2.5 33.3% 1 1.31s 180 0
Laguna Xs.2 5.0 10.0 0.0% 0 16.04s 200 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 6.3 10.0 50.0% 0 787ms 84 0
Laguna Xs.2 6.5 10.0 50.0% 0 439ms 81 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 3.7 7.3 22.2% 1 1.29s 348 0
Laguna Xs.2 5.4 10.0 33.3% 0 688ms 552 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Nano 10.0 10.0 100.0% 0 3.40s 222 0
Laguna Xs.2 3.0 10.0 0.0% 0 1.93s 392 0

झटपट तुलना

तुलना जोडी बदला