नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 vs OpenAI: GPT-5.5

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-24

मेट्रिक GPT-5.4 GPT-5.4 medium प्रकाशन: 2026-03-05 GPT-5.5 GPT-5.5 medium प्रकाशन: 2026-04-24
स्कोअर 8.2 9.0
क्रमांक #18 #5
विश्वसनीयता लागू नाही लागू नाही
सुसंगतता 8.7 9.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 79.6% 87.0%
अस्थिर चाचण्या 3 2
एकूण रन 54 54
प्रति निकाल खर्च 6.399 19.226
एकूण खर्च $0.832 $2.884
???? ??? $2.500 / 1M $5.000 / 1M
????? ??? $15.000 / 1M $30.000 / 1M
आउटपुट टोकन्स 2,169 1,920
रिझनिंग टोकन्स 48,732 89,632
प्रतिसाद वेळ (सरासरी) 18.63s 32.75s
प्रतिसाद वेळ (कमाल) 100.41s 332.10s
प्रतिसाद वेळ (एकूण) 335.26s 589.59s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 8.3 10.0 75.0% 0 4.11s 240 1,511
GPT-5.5 10.0 10.0 100.0% 0 4.66s 250 1,335
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 13.03s 389 2,045
GPT-5.5 10.0 10.0 100.0% 0 9.09s 318 1,391
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
GPT-5.5 10.0 10.0 100.0% 0 19.29s 312 2,841
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
GPT-5.5 10.0 10.0 100.0% 0 4.18s 234 593
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
GPT-5.5 5.3 7.2 44.4% 1 164.14s 67 79,625
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
GPT-5.5 10.0 10.0 100.0% 0 4.16s 138 223
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
GPT-5.5 10.0 10.0 100.0% 0 3.36s 93 538
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
GPT-5.5 8.6 7.9 77.8% 1 6.78s 250 2,254
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
GPT-5.5 10.0 10.0 100.0% 0 10.57s 258 832

झटपट तुलना

तुलना जोडी बदला