नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Mistral: Mistral Small 4 vs OpenAI: GPT-5.4 Mini

सारांश

Mistral Small 4 vs GPT-5.4 Mini benchmark तुलना: GPT-5.4 Mini average score में आगे है: 5.3 vs 5.1. GPT-5.4 Mini की benchmark लागत कम है: $0.038 vs $0.068. GPT-5.4 Mini तेज है: 1.13s vs 9.40s, pass rates 44.4% vs 30.2%.

अनुशंसित मॉडल: GPT-5.4 Mini - It has the best score here (5.3), while costing about 1.8x less than Mistral Small 4.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक Mistral Small 4 Mistral Small 4 medium रिलीज़: 2026-03-16 GPT-5.4 Mini GPT-5.4 Mini none रिलीज़: 2026-03-17
स्कोर 5.1 5.3
रैंक #138 #131
विश्वसनीयता 10.0 10.0
संगति 6.9 8.8
सही परीक्षण
प्रति प्रयास पास दर 44.4% 30.2%
अस्थिर टेस्ट 8 3
कुल रन 63 63
प्रति परिणाम लागत 1.344 0.743
कुल लागत $0.068 $0.038
इनपुट कीमत $0.150 / 1M $0.750 / 1M
आउटपुट कीमत $0.600 / 1M $4.500 / 1M
कुल इनपुट टोकन 42,576 34,244
आउटपुट टोकन 24,184 2,541
रीजनिंग टोकन 84,678 0
प्रतिक्रिया समय (औसत) 9.40s 1.13s
प्रतिक्रिया समय (अधिकतम) 59.15s 2.52s
प्रतिक्रिया समय (कुल) 197.39s 23.82s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#138 Mistral Small 4

medium
Cost
$0.006
Time
47.9s
Tokens
9,857 tok

#131 GPT-5.4 Mini

none
Cost
$0.010
Time
11.7s
Tokens
2,151 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 708 4,055 4,778
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 606 654 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 4.4 5.1 33.3% 2 39.98s 7,636 11,635 54,715
GPT-5.4 Mini 5.5 10.0 33.3% 0 913ms 7,305 401 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 18,706 2,612 10,700
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 11,019 298 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 6,171 335 723
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 7,140 222 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 742 2,621 6,904
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 723 88 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 519 821 828
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 477 174 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 729 540 1,031
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 660 101 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.4 9.7 0.0% 0 2.17s 735 1,226 2,632
GPT-5.4 Mini 5.4 10.0 33.3% 0 836ms 642 305 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 6,420 321 810
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 5,477 255 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.0 10.0 0.0% 0 5.92s 210 18 1,557
GPT-5.4 Mini 3.0 10.0 0.0% 0 1.33s 195 43 0

त्वरित तुलना

तुलना जोड़ी बदलें