नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

North Mini Code vs xAI: Grok 4.20

सारांश

North Mini Code vs Grok 4.20 benchmark तुलना: North Mini Code average score में आगे है: 5.8 vs 4.4. North Mini Code की benchmark लागत कम है: $0.000 vs $0.057. Grok 4.20 तेज है: 1.11s vs 106.18s, pass rates 50.8% vs 28.6%.

अनुशंसित मॉडल: North Mini Code - It has the strongest score in this comparison (5.8) and the best overall balance of cost and response time across all 2 models.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक North Mini Code North Mini Code medium रिलीज़: 2026-06-18 निःशुल्क उपलब्ध Grok 4.20 Grok 4.20 none रिलीज़: 2026-03-31
स्कोर 5.8 4.4
रैंक #110 #160
विश्वसनीयता 8.5 लागू नहीं
संगति 8.5 8.5
सही परीक्षण
प्रति प्रयास पास दर 50.8% 28.6%
अस्थिर टेस्ट 4 0
कुल रन 55 54
प्रति परिणाम लागत 0.000 1.570
कुल लागत $0.000 $0.057
इनपुट कीमत $0.000 / 1M $1.250 / 1M
आउटपुट कीमत $0.000 / 1M $2.500 / 1M
कुल इनपुट टोकन 32,891 41,313
आउटपुट टोकन 424,772 1,923
रीजनिंग टोकन 1,021,489 0
प्रतिक्रिया समय (औसत) 106.18s 1.11s
प्रतिक्रिया समय (अधिकतम) 357.05s 6.04s
प्रतिक्रिया समय (कुल) 2229.70s 19.96s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#110 North Mini Code

medium
लागत
$0.000
समय
51.8s
टोकन
12,460 tok

#160 xAI: Grok 4.20

none
लागत
$0.004
समय
6.5s
टोकन
1,367 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 8.4 10.0 75.0% 0 64.79s 324 64,441 68,535
Grok 4.20 4.8 10.0 25.0% 0 501ms 1,986 267 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 4.5 4.9 33.3% 2 320.43s 7,119 219,891 561,569
Grok 4.20 1.1 3.1 0.0% 0 1.22s 1,074 312 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 2.8 1.6 33.3% 1 323.07s 14,760 0 151,500
Grok 4.20 3.0 10.0 0.0% 0 6.04s 17,673 282 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 10.0 10.0 100.0% 0 24.06s 6,819 240 2,659
Grok 4.20 10.0 10.0 100.0% 0 522ms 7,749 207 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 5.3 7.2 44.4% 1 71.37s 621 8,483 104,079
Grok 4.20 3.0 10.0 0.0% 0 687ms 1,746 325 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 5.1 10.0 0.0% 0 25.08s 444 1,546 1,635
Grok 4.20 4.8 10.0 0.0% 0 659ms 819 83 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 9.8 10.0 100.0% 0 15.43s 379 909 1,339
Grok 4.20 6.3 10.0 50.0% 0 445ms 1,350 60 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 3.3 10.0 0.0% 0 19.70s 543 2,215 2,485
Grok 4.20 5.3 10.0 33.3% 0 473ms 1,671 198 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 10.0 10.0 100.0% 0 3.93s 1,776 41 563
Grok 4.20 10.0 10.0 100.0% 0 4.63s 7,245 189 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 3.0 10.0 0.0% 0 305.02s 106 127,006 127,125
Grok 4.20 0.0 0.0 0.0% 0 0ms 0 0 0

त्वरित तुलना

तुलना जोड़ी बदलें