नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Mistral: Mistral Small 4 vs OpenAI: GPT-5.4 Nano

सारांश

Mistral Small 4 vs GPT-5.4 Nano benchmark तुलना: Mistral Small 4 average score में आगे है: 5.1 vs 4.8. GPT-5.4 Nano की benchmark लागत कम है: $0.011 vs $0.068. GPT-5.4 Nano तेज है: 1.48s vs 9.40s, pass rates 44.4% vs 30.2%.

अनुशंसित मॉडल: GPT-5.4 Nano - Its score stays close to the best score here (4.8 vs 5.1), while costing about 6.5x less than Mistral Small 4.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक Mistral Small 4 Mistral Small 4 medium रिलीज़: 2026-03-16 GPT-5.4 Nano GPT-5.4 Nano none रिलीज़: 2026-03-17
स्कोर 5.1 4.8
रैंक #138 #149
विश्वसनीयता 10.0 10.0
संगति 6.9 8.2
सही परीक्षण
प्रति प्रयास पास दर 44.4% 30.2%
अस्थिर टेस्ट 8 5
कुल रन 63 63
प्रति परिणाम लागत 1.344 0.259
कुल लागत $0.068 $0.011
इनपुट कीमत $0.150 / 1M $0.200 / 1M
आउटपुट कीमत $0.600 / 1M $1.250 / 1M
कुल इनपुट टोकन 42,576 34,212
आउटपुट टोकन 24,184 2,784
रीजनिंग टोकन 84,678 0
प्रतिक्रिया समय (औसत) 9.40s 1.48s
प्रतिक्रिया समय (अधिकतम) 59.15s 4.47s
प्रतिक्रिया समय (कुल) 197.39s 31.01s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#138 Mistral Small 4

medium
Cost
$0.006
Time
47.9s
Tokens
9,857 tok

#149 GPT-5.4 Nano

none
Cost
$0.008
Time
46.1s
Tokens
5,735 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 708 4,055 4,778
GPT-5.4 Nano 3.5 8.0 16.7% 1 1.18s 606 800 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 4.4 5.1 33.3% 2 39.98s 7,636 11,635 54,715
GPT-5.4 Nano 4.6 7.9 22.2% 1 2.22s 7,305 613 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 18,706 2,612 10,700
GPT-5.4 Nano 3.0 10.0 0.0% 0 3.84s 11,019 280 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 6,171 335 723
GPT-5.4 Nano 6.5 10.0 50.0% 0 1.11s 7,140 219 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 742 2,621 6,904
GPT-5.4 Nano 2.9 4.4 22.2% 2 926ms 723 52 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 519 821 828
GPT-5.4 Nano 3.8 2.5 33.3% 1 1.31s 477 180 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 729 540 1,031
GPT-5.4 Nano 6.3 10.0 50.0% 0 784ms 660 89 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.4 9.7 0.0% 0 2.17s 735 1,226 2,632
GPT-5.4 Nano 5.4 10.0 33.3% 0 1.25s 642 308 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 6,420 321 810
GPT-5.4 Nano 10.0 10.0 100.0% 0 3.40s 5,445 222 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.0 10.0 0.0% 0 5.92s 210 18 1,557
GPT-5.4 Nano 3.0 10.0 0.0% 0 773ms 195 21 0

त्वरित तुलना

तुलना जोड़ी बदलें