नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

DeepSeek: DeepSeek V4 Flash vs OpenAI: GPT-5.5

सारांश

DeepSeek V4 Flash vs GPT-5.5 benchmark तुलना: GPT-5.5 average score में आगे है: 9.3 vs 8.3. DeepSeek V4 Flash की benchmark लागत कम है: $0.027 vs $0.907. GPT-5.5 तेज है: 9.76s vs 45.85s, pass rates 74.6% vs 85.7%.

अनुशंसित मॉडल: DeepSeek V4 Flash - It offers the best overall trade-off: a competitive score (8.3), lower cost than GPT-5.5, and balanced response time.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक DeepSeek V4 Flash DeepSeek V4 Flash high रिलीज़: 2026-04-24 GPT-5.5 GPT-5.5 low रिलीज़: 2026-04-24
स्कोर 8.3 9.3
रैंक #23 #4
विश्वसनीयता 10.0 10.0
संगति 8.5 10.0
सही परीक्षण
प्रति प्रयास पास दर 74.6% 85.7%
अस्थिर टेस्ट 4 0
कुल रन 63 63
प्रति परिणाम लागत 0.299 5.035
कुल लागत $0.027 $0.907
इनपुट कीमत $0.090 / 1M $5.000 / 1M
आउटपुट कीमत $0.180 / 1M $30.000 / 1M
कुल इनपुट टोकन 39,745 34,209
आउटपुट टोकन 10,310 2,046
रीजनिंग टोकन 123,501 22,460
प्रतिक्रिया समय (औसत) 45.85s 9.76s
प्रतिक्रिया समय (अधिकतम) 218.13s 56.19s
प्रतिक्रिया समय (कुल) 962.79s 204.92s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#23 DeepSeek V4 Flash

high
लागत
$0.003
समय
93.1s
टोकन
7,926 tok

#4 GPT-5.5

low
लागत
$0.068
समय
37.0s
टोकन
2,339 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 540 140 7,770
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 7.8 10.0 66.7% 0 50.60s 7,279 395 34,862
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 14,016 465 7,347
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 7,290 201 1,179
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 4.1 4.4 44.5% 2 100.31s 666 27 59,249
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 471 79 632
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 627 63 1,622
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 8.2 7.2 88.9% 1 26.11s 594 196 1,767
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 8,079 228 542
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 3.0 10.0 0.0% 0 54.46s 183 8,516 8,531
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840

त्वरित तुलना

तुलना जोड़ी बदलें