नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

MoonshotAI: Kimi K2.7 Code vs Qwen: Qwen3.7 Max

सारांश

Kimi K2.7 Code vs Qwen3.7 Max benchmark तुलना: Kimi K2.7 Code average score में आगे है: 7.0 vs 6.9. Qwen3.7 Max की benchmark लागत कम है: $0.054 vs $0.669. Qwen3.7 Max तेज है: 1.30s vs 83.60s, pass rates 66.7% vs 66.7%.

अनुशंसित मॉडल: Qwen3.7 Max - Its score stays close to the best score here (6.9 vs 7.0), while costing about 12.4x less than Kimi K2.7 Code.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक Kimi K2.7 Code Kimi K2.7 Code medium रिलीज़: 2026-06-12 Qwen3.7 Max Qwen3.7 Max none रिलीज़: 2026-05-22
स्कोर 7.0 6.9
रैंक #65 #69
विश्वसनीयता 9.2 10.0
संगति 7.7 10.0
सही परीक्षण
प्रति प्रयास पास दर 66.7% 66.7%
अस्थिर टेस्ट 6 0
कुल रन 63 63
प्रति परिणाम लागत 6.074 0.744
कुल लागत $0.669 $0.054
इनपुट कीमत $0.950 / 1M $1.250 / 1M
आउटपुट कीमत $4.000 / 1M $3.750 / 1M
कुल इनपुट टोकन 25,991 37,107
आउटपुट टोकन 80,516 1,994
रीजनिंग टोकन 161,391 0
प्रतिक्रिया समय (औसत) 83.60s 1.30s
प्रतिक्रिया समय (अधिकतम) 365.80s 3.92s
प्रतिक्रिया समय (कुल) 1671.99s 27.21s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#65 MoonshotAI: Kimi K2.7 Code

medium
Cost
$0.025
Time
138.0s
Tokens
6,093 tok

#69 Qwen3.7 Max

none
Cost
$0.046
Time
195.0s
Tokens
12,171 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Kimi K2.7 Code 7.3 5.8 83.3% 2 11.56s 618 3,048 5,041
Qwen3.7 Max 6.5 10.0 50.0% 0 1.08s 696 242 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Kimi K2.7 Code 7.6 7.2 77.8% 1 146.73s 4,650 1,864 25,635
Qwen3.7 Max 5.5 10.0 33.3% 0 1.35s 7,911 582 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Kimi K2.7 Code 4.7 1.6 66.7% 1 34.83s 11,271 444 3,906
Qwen3.7 Max 3.0 10.0 0.0% 0 2.17s 9,549 171 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Kimi K2.7 Code 10.0 10.0 100.0% 0 12.27s 7,014 248 2,569
Qwen3.7 Max 10.0 10.0 100.0% 0 1.35s 7,794 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Kimi K2.7 Code 5.3 7.2 44.4% 1 213.29s 431 55,572 63,639
Qwen3.7 Max 7.7 10.0 66.7% 0 975ms 789 15 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Kimi K2.7 Code 10.0 10.0 100.0% 0 10.78s 477 1,024 1,071
Qwen3.7 Max 10.0 10.0 100.0% 0 1.04s 522 120 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Kimi K2.7 Code 9.9 10.0 100.0% 0 5.39s 669 725 1,232
Qwen3.7 Max 10.0 10.0 100.0% 0 943ms 711 72 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Kimi K2.7 Code 5.9 7.7 44.4% 1 41.00s 651 15,438 17,368
Qwen3.7 Max 10.0 10.0 100.0% 0 1.13s 714 314 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Kimi K2.7 Code 3.0 10.0 0.0% 0 0ms 0 0 0
Qwen3.7 Max 10.0 10.0 100.0% 0 3.92s 8,211 222 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Kimi K2.7 Code 3.0 10.0 0.0% 0 341.76s 210 2,153 40,930
Qwen3.7 Max 3.0 10.0 0.0% 0 856ms 210 13 0

त्वरित तुलना

तुलना जोड़ी बदलें