नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

North Mini Code vs OpenAI: GPT-5.4 Mini

सारांश

North Mini Code vs GPT-5.4 Mini benchmark तुलना: North Mini Code average score में आगे है: 5.8 vs 5.3. North Mini Code की benchmark लागत कम है: $0.000 vs $0.038. GPT-5.4 Mini तेज है: 1.13s vs 106.18s, pass rates 50.8% vs 30.2%.

अनुशंसित मॉडल: GPT-5.4 Mini - Its score stays close to the best score here (5.3 vs 5.8), while responding about 93.6x faster than North Mini Code.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक North Mini Code North Mini Code medium रिलीज़: 2026-06-18 निःशुल्क उपलब्ध GPT-5.4 Mini GPT-5.4 Mini none रिलीज़: 2026-03-17
स्कोर 5.8 5.3
रैंक #107 #124
विश्वसनीयता 8.5 10.0
संगति 8.5 8.8
सही परीक्षण
प्रति प्रयास पास दर 50.8% 30.2%
अस्थिर टेस्ट 4 3
कुल रन 55 63
प्रति परिणाम लागत 0.000 0.743
कुल लागत $0.000 $0.038
इनपुट कीमत $0.000 / 1M $0.750 / 1M
आउटपुट कीमत $0.000 / 1M $4.500 / 1M
कुल इनपुट टोकन 32,891 34,244
आउटपुट टोकन 424,772 2,541
रीजनिंग टोकन 1,021,489 0
प्रतिक्रिया समय (औसत) 106.18s 1.13s
प्रतिक्रिया समय (अधिकतम) 357.05s 2.52s
प्रतिक्रिया समय (कुल) 2229.70s 23.82s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#107 North Mini Code

medium
लागत
$0.000
समय
51.8s
टोकन
12,460 tok

#124 GPT-5.4 Mini

none
लागत
$0.010
समय
11.7s
टोकन
2,151 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 8.4 10.0 75.0% 0 64.79s 324 64,441 68,535
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 606 654 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 4.5 4.9 33.3% 2 320.43s 7,119 219,891 561,569
GPT-5.4 Mini 5.5 10.0 33.3% 0 913ms 7,305 401 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 2.8 1.6 33.3% 1 323.07s 14,760 0 151,500
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 11,019 298 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 10.0 10.0 100.0% 0 24.06s 6,819 240 2,659
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 7,140 222 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 5.3 7.2 44.4% 1 71.37s 621 8,483 104,079
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 723 88 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 5.1 10.0 0.0% 0 25.08s 444 1,546 1,635
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 477 174 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 9.8 10.0 100.0% 0 15.43s 379 909 1,339
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 660 101 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 3.3 10.0 0.0% 0 19.70s 543 2,215 2,485
GPT-5.4 Mini 5.4 10.0 33.3% 0 836ms 642 305 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 10.0 10.0 100.0% 0 3.93s 1,776 41 563
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 5,477 255 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 3.0 10.0 0.0% 0 305.02s 106 127,006 127,125
GPT-5.4 Mini 3.0 10.0 0.0% 0 1.33s 195 43 0

त्वरित तुलना

तुलना जोड़ी बदलें