नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Fable 5 vs StepFun: Step 3.7 Flash

सारांश

Claude Fable 5 vs Step 3.7 Flash benchmark तुलना: Claude Fable 5 average score मध्ये पुढे आहे: 9.2 vs 7.7. Step 3.7 Flash चा benchmark खर्च कमी आहे: $0.341 vs $3.165. Step 3.7 Flash वेगवान आहे: 15.74s vs 17.01s, pass rates 82.5% vs 68.3%.

शिफारस केलेले मॉडेल: Step 3.7 Flash - It offers the best overall trade-off: a competitive score (7.7), lower cost than Claude Fable 5, and balanced response time.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-12

मेट्रिक Claude Fable 5 Claude Fable 5 medium प्रकाशन: 2026-06-10 Step 3.7 Flash Step 3.7 Flash low प्रकाशन: 2026-05-29
स्कोअर 9.2 7.7
क्रमांक #9 #42
विश्वसनीयता 10.0 10.0
सुसंगतता 9.6 8.4
बरोबर चाचण्या
प्रति प्रयत्न पास दर 82.5% 68.3%
अस्थिर चाचण्या 1 4
एकूण रन 63 63
प्रति निकाल खर्च 18.614 2.840
एकूण खर्च $3.165 $0.341
इनपुट किंमत $10.000 / 1M $0.200 / 1M
आउटपुट किंमत $50.000 / 1M $1.150 / 1M
एकूण इनपुट टोकन्स 58,383 40,101
आउटपुट टोकन्स 41,340 289,325
रिझनिंग टोकन्स 10,269 0
प्रतिसाद वेळ (सरासरी) 17.01s 15.74s
प्रतिसाद वेळ (कमाल) 80.80s 124.75s
प्रतिसाद वेळ (एकूण) 357.17s 330.63s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#9 Claude Fable 5

medium
Cost
$0.606
Time
156.7s
Tokens
12,264 tok

#42 Step 3.7 Flash

low
Invalid SVG
Cost
$0.004
Time
25.3s
Tokens
3,072 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Fable 5 10.0 10.0 100.0% 0 6.20s 834 530 402
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 756 10,896 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Fable 5 10.0 10.0 100.0% 0 15.59s 10,590 7,383 1,318
Step 3.7 Flash 8.2 7.2 88.9% 1 9.46s 7,437 18,685 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Fable 5 10.0 10.0 100.0% 0 33.70s 20,937 2,353 1,599
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 13,683 6,426 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Fable 5 10.0 10.0 100.0% 0 7.18s 10,503 521 363
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 7,398 2,667 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Fable 5 5.3 7.2 44.4% 1 53.40s 975 25,215 5,001
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 828 104,487 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Fable 5 10.0 10.0 100.0% 0 7.42s 708 366 144
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 525 4,604 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Fable 5 10.0 10.0 100.0% 0 5.90s 909 139 202
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 735 1,857 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Fable 5 7.7 10.0 66.7% 0 5.18s 894 402 324
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 756 3,564 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Fable 5 10.0 10.0 100.0% 0 16.96s 11,775 729 344
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 7,746 1,360 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Fable 5 3.0 10.0 0.0% 0 25.64s 258 3,702 572
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 237 134,779 0

झटपट तुलना

तुलना जोडी बदला