नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

North Mini Code vs Poolside: Laguna XS 2.1

सारांश

North Mini Code vs Laguna XS 2.1 benchmark तुलना: North Mini Code average score में आगे है: 5.8 vs 5.3. North Mini Code की benchmark लागत कम है: $0.000 vs $0.003. Laguna XS 2.1 तेज है: 722ms vs 106.18s, pass rates 50.8% vs 31.8%.

अनुशंसित मॉडल: Laguna XS 2.1 - Its score stays close to the best score here (5.3 vs 5.8), while responding about 147.0x faster than North Mini Code.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक North Mini Code North Mini Code medium रिलीज़: 2026-06-18 निःशुल्क उपलब्ध Laguna XS 2.1 Laguna XS 2.1 none रिलीज़: 2026-07-02 निःशुल्क उपलब्ध
स्कोर 5.8 5.3
रैंक #110 #128
विश्वसनीयता 8.5 10.0
संगति 8.5 9.0
सही परीक्षण
प्रति प्रयास पास दर 50.8% 31.8%
अस्थिर टेस्ट 4 3
कुल रन 55 63
प्रति परिणाम लागत 0.000 0.058
कुल लागत $0.000 $0.003
इनपुट कीमत $0.000 / 1M $0.060 / 1M
आउटपुट कीमत $0.000 / 1M $0.120 / 1M
कुल इनपुट टोकन 32,891 41,148
आउटपुट टोकन 424,772 3,451
रीजनिंग टोकन 1,021,489 0
प्रतिक्रिया समय (औसत) 106.18s 722ms
प्रतिक्रिया समय (अधिकतम) 357.05s 2.30s
प्रतिक्रिया समय (कुल) 2229.70s 15.17s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#110 North Mini Code

medium
लागत
$0.000
समय
51.8s
टोकन
12,460 tok

#128 Laguna XS 2.1

none
लागत
$0.001
समय
27.6s
टोकन
4,344 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 8.4 10.0 75.0% 0 64.79s 324 64,441 68,535
Laguna XS 2.1 5.3 8.3 33.3% 1 755ms 774 1,015 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 4.5 4.9 33.3% 2 320.43s 7,119 219,891 561,569
Laguna XS 2.1 4.3 7.8 22.2% 1 623ms 7,995 562 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 2.8 1.6 33.3% 1 323.07s 14,760 0 151,500
Laguna XS 2.1 3.0 10.0 0.0% 0 1.76s 14,197 402 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 10.0 10.0 100.0% 0 24.06s 6,819 240 2,659
Laguna XS 2.1 10.0 10.0 100.0% 0 768ms 7,734 240 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 5.3 7.2 44.4% 1 71.37s 621 8,483 104,079
Laguna XS 2.1 5.3 10.0 33.3% 0 364ms 834 14 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 5.1 10.0 0.0% 0 25.08s 444 1,546 1,635
Laguna XS 2.1 5.0 10.0 0.0% 0 529ms 537 128 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 9.8 10.0 100.0% 0 15.43s 379 909 1,339
Laguna XS 2.1 3.8 5.8 33.3% 1 364ms 638 50 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 3.3 10.0 0.0% 0 19.70s 543 2,215 2,485
Laguna XS 2.1 3.0 10.0 0.0% 0 1.01s 771 730 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 10.0 10.0 100.0% 0 3.93s 1,776 41 563
Laguna XS 2.1 10.0 10.0 100.0% 0 1.36s 7,413 300 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
North Mini Code 3.0 10.0 0.0% 0 305.02s 106 127,006 127,125
Laguna XS 2.1 3.0 10.0 0.0% 0 254ms 255 10 0

त्वरित तुलना

तुलना जोड़ी बदलें