नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs xAI: Grok 4.20

सारांश

GPT-5.4 Mini vs Grok 4.20 benchmark तुलना: GPT-5.4 Mini average score मध्ये पुढे आहे: 5.3 vs 4.4. GPT-5.4 Mini चा benchmark खर्च कमी आहे: $0.038 vs $0.057. Grok 4.20 वेगवान आहे: 1.11s vs 1.13s, pass rates 30.2% vs 28.6%.

शिफारस केलेले मॉडेल: GPT-5.4 Mini - It has the best score here (5.3), while costing about 1.5x less than Grok 4.20.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-07-02

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini none प्रकाशन: 2026-03-17 Grok 4.20 Grok 4.20 none प्रकाशन: 2026-03-31
स्कोअर 5.3 4.4
क्रमांक #129 #160
विश्वसनीयता 10.0 लागू नाही
सुसंगतता 8.8 8.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 30.2% 28.6%
अस्थिर चाचण्या 3 0
एकूण रन 63 54
प्रति निकाल खर्च 0.743 1.570
एकूण खर्च $0.038 $0.057
इनपुट किंमत $0.750 / 1M $1.250 / 1M
आउटपुट किंमत $4.500 / 1M $2.500 / 1M
एकूण इनपुट टोकन्स 34,244 41,313
आउटपुट टोकन्स 2,541 1,923
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 1.13s 1.11s
प्रतिसाद वेळ (कमाल) 2.52s 6.04s
प्रतिसाद वेळ (एकूण) 23.82s 19.96s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#129 GPT-5.4 Mini

none
खर्च
$0.010
वेळ
11.7s
टोकन्स
2,151 tok

#160 xAI: Grok 4.20

none
खर्च
$0.004
वेळ
6.5s
टोकन्स
1,367 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 606 654 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 1,986 267 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 5.5 10.0 33.3% 0 913ms 7,305 401 0
Grok 4.20 1.1 3.1 0.0% 0 1.22s 1,074 312 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 11,019 298 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 17,673 282 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 7,140 222 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 7,749 207 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 723 88 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 1,746 325 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 477 174 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 819 83 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 660 101 0
Grok 4.20 6.3 10.0 50.0% 0 445ms 1,350 60 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 5.4 10.0 33.3% 0 836ms 642 305 0
Grok 4.20 5.3 10.0 33.3% 0 473ms 1,671 198 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 5,477 255 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 7,245 189 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.0 10.0 0.0% 0 1.33s 195 43 0
Grok 4.20 0.0 0.0 0.0% 0 0ms 0 0 0

झटपट तुलना

तुलना जोडी बदला