AI BENCHY तुलना

Anthropic: Claude Fable 5 vs Qwen: Qwen3.7 Max

सारांश

Claude Fable 5 vs Qwen3.7 Max benchmark तुलना: Qwen3.7 Max average score में आगे है: 9.4 vs 9.2. Qwen3.7 Max की benchmark लागत कम है: $0.523 vs $3.165. Qwen3.7 Max तेज है: 16.02s vs 17.01s, pass rates 82.5% vs 88.9%.

अनुशंसित मॉडल: Qwen3.7 Max - It has the best score here (9.4), while costing about 6.1x less than Claude Fable 5.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक	Claude Fable 5 Claude Fable 5 medium रिलीज़: 2026-06-10	Qwen3.7 Max Qwen3.7 Max medium रिलीज़: 2026-05-22

मेट्रिक	Claude Fable 5 Claude Fable 5 medium रिलीज़: 2026-06-10	Qwen3.7 Max Qwen3.7 Max medium रिलीज़: 2026-05-22
स्कोर	9.2	9.4
रैंक	#9	#4
विश्वसनीयता	10.0	10.0
संगति	9.6	9.6
सही परीक्षण
प्रति प्रयास पास दर	82.5%	88.9%
अस्थिर टेस्ट	1	1
कुल रन	63	63
प्रति परिणाम लागत	18.614	5.517
कुल लागत	$3.165	$0.523
इनपुट कीमत	$10.000 / 1M	$1.250 / 1M
आउटपुट कीमत	$50.000 / 1M	$3.750 / 1M
कुल इनपुट टोकन	58,383	42,360
आउटपुट टोकन	41,340	2,129
रीजनिंग टोकन	10,269	122,959
प्रतिक्रिया समय (औसत)	17.01s	16.02s
प्रतिक्रिया समय (अधिकतम)	80.80s	59.98s
प्रतिक्रिया समय (कुल)	357.17s	336.51s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#9 Claude Fable 5

medium

Cost: $0.606
Time: 156.7s
Tokens: 12,264 tok

#4 Qwen3.7 Max

medium

Cost: $0.017
Time: 68.8s
Tokens: 4,526 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	10.0	10.0	100.0%	0		6.20s	834	530	402
Qwen3.7 Max	10.0	10.0	100.0%	0		6.36s	672	222	8,742

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	10.0	10.0	100.0%	0		15.59s	10,590	7,383	1,318
Qwen3.7 Max	10.0	10.0	100.0%	0		35.31s	7,893	423	34,808

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	10.0	10.0	100.0%	0		33.70s	20,937	2,353	1,599
Qwen3.7 Max	10.0	10.0	100.0%	0		19.60s	14,934	366	8,405

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	10.0	10.0	100.0%	0		7.18s	10,503	521	363
Qwen3.7 Max	10.0	10.0	100.0%	0		8.80s	7,782	270	6,254

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	5.3	7.2	44.4%	1		53.40s	975	25,215	5,001
Qwen3.7 Max	5.9	7.2	55.6%	1		24.94s	771	61	31,793

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	10.0	10.0	100.0%	0		7.42s	708	366	144
Qwen3.7 Max	10.0	10.0	100.0%	0		11.70s	516	135	4,457

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	10.0	10.0	100.0%	0		5.90s	909	139	202
Qwen3.7 Max	10.0	10.0	100.0%	0		7.46s	699	102	5,452

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	7.7	10.0	66.7%	0		5.18s	894	402	324
Qwen3.7 Max	10.0	10.0	100.0%	0		8.84s	696	259	8,908

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	10.0	10.0	100.0%	0		16.96s	11,775	729	344
Qwen3.7 Max	10.0	10.0	100.0%	0		6.63s	8,193	267	1,220

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Fable 5	3.0	10.0	0.0%	0		25.64s	258	3,702	572
Qwen3.7 Max	3.0	10.0	0.0%	0		33.37s	204	24	12,920

त्वरित तुलना

तुलना जोड़ी बदलें

Claude Fable 5mediumvsGemini 3.5 Flashlow GPT-5.5lowvsQwen3.7 Maxmedium Claude Fable 5mediumvsGPT-5.5low Gemini 3.5 FlashlowvsQwen3.7 Maxmedium Gemini 3.5 FlashhighvsQwen3.7 Maxmedium Claude Fable 5mediumvsGemini 3.5 Flashhigh Claude Fable 5mediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsQwen3.7 Maxmedium Claude Fable 5mediumvsDeepSeek V4 Flashhigh DeepSeek V4 FlashhighvsQwen3.7 Maxmedium Claude Fable 5mediumvsStep 3.7 Flashlow Qwen3.7 MaxmediumvsStep 3.7 Flashlow