नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Mistral: Mistral Small 4 vs OpenAI: GPT-5.5

सारांश

Mistral Small 4 vs GPT-5.5 benchmark तुलना: GPT-5.5 average score में आगे है: 9.3 vs 5.1. Mistral Small 4 की benchmark लागत कम है: $0.007 vs $0.907. Mistral Small 4 तेज है: 630ms vs 9.76s, pass rates 27.0% vs 85.7%.

अनुशंसित मॉडल: Mistral Small 4 - It offers the best overall trade-off: a competitive score (5.1), lower cost than GPT-5.5, and balanced response time.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक Mistral Small 4 Mistral Small 4 none रिलीज़: 2026-03-16 GPT-5.5 GPT-5.5 low रिलीज़: 2026-04-24
स्कोर 5.1 9.3
रैंक #136 #5
विश्वसनीयता 10.0 10.0
संगति 9.5 10.0
सही परीक्षण
प्रति प्रयास पास दर 27.0% 85.7%
अस्थिर टेस्ट 1 0
कुल रन 63 63
प्रति परिणाम लागत 0.139 5.035
कुल लागत $0.007 $0.907
इनपुट कीमत $0.150 / 1M $5.000 / 1M
आउटपुट कीमत $0.600 / 1M $30.000 / 1M
कुल इनपुट टोकन 37,309 34,209
आउटपुट टोकन 2,201 2,046
रीजनिंग टोकन 0 22,460
प्रतिक्रिया समय (औसत) 630ms 9.76s
प्रतिक्रिया समय (अधिकतम) 1.72s 56.19s
प्रतिक्रिया समय (कुल) 13.22s 204.92s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#136 Mistral Small 4

none
Cost
$0.002
Time
10.4s
Tokens
2,370 tok

#5 GPT-5.5

low
Cost
$0.068
Time
37.0s
Tokens
2,339 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.4 7.9 16.7% 1 395ms 708 182 0
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.7 9.7 0.0% 0 901ms 7,636 619 0
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.0 10.0 0.0% 0 1.72s 11,640 496 0
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 10.0 10.0 100.0% 0 822ms 7,914 261 0
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.3 10.0 33.3% 0 367ms 798 28 0
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 4.0 10.0 0.0% 0 729ms 519 205 0
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 6.5 10.0 50.0% 0 380ms 729 69 0
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.1 9.9 0.0% 0 399ms 735 111 0
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 10.0 10.0 100.0% 0 1.40s 6,420 213 0
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.0 10.0 0.0% 0 397ms 210 17 0
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840

त्वरित तुलना

तुलना जोड़ी बदलें