ナビゲーション
AI BENCHY
Advertise here

AI BENCHY Compare

Cobuddy vs DeepSeek: DeepSeek V3.2

概要

Cobuddy vs DeepSeek V3.2 の benchmark 比較: DeepSeek V3.2 が平均スコアでリードし、5.3 vs 4.9 です。 Cobuddy の benchmark コストが低く、$0.000 vs $0.017 です。 DeepSeek V3.2 の方が高速で、13.83s vs 39.90s です、成功率は 47.6% vs 39.7% です。

おすすめモデル: DeepSeek V3.2 - ここでは最高スコア(5.3)で、Cobuddy より約 2.9 倍速く応答します。

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-06-18

指標 Cobuddy Cobuddy medium リリース: 2026-05-06 DeepSeek V3.2 DeepSeek V3.2 none リリース: 2025-12-01
スコア 4.9 5.3
順位 #140 #126
信頼性 10.0 10.0
一貫性 7.5 7.6
正解テスト
試行ごとの合格率 47.6% 39.7%
不安定なテスト 6 6
総実行回数 63 63
結果あたりのコスト 0.000 0.306
合計コスト $0.000 $0.017
入力価格 $0.000 / 1M $0.229 / 1M
出力価格 $0.000 / 1M $0.344 / 1M
合計入力トークン 37,449 55,997
出力トークン 1,677 11,165
推論トークン 116,703 0
応答時間(平均) 39.90s 13.83s
応答時間(最大) 309.02s 115.89s
応答時間(合計) 797.98s 290.43s

生成ショーケース

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#140 Cobuddy

medium
No endpoints found for baidu/cobuddy:free.
コスト
$0.000
時間
0.1s
トークン
0 tok

#126 DeepSeek V3.2

none
コスト
$0.002
時間
7.0s
トークン
1,046 tok

スコア上位モデル

スコア vs 総コスト

応答時間(平均)

スコア vs 応答時間(平均)

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 8.7 7.9 91.7% 1 10.00s 453 98 4,666
DeepSeek V3.2 3.2 8.0 8.3% 1 9.35s 494 1,073 0
コーディング スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 3.7 6.7 22.2% 1 79.17s 4,726 358 30,138
DeepSeek V3.2 3.1 6.9 11.1% 1 14.54s 7,279 4,528 0
複合 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 3.0 10.0 0.0% 0 47.38s 18,324 465 7,265
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 29,843 2,887 0
データ解析と抽出 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 6.3 5.8 66.7% 1 17.36s 8,181 275 5,591
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 7,890 1,710 0
ドメイン特化 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 2.9 4.4 22.2% 2 128.15s 540 10 49,454
DeepSeek V3.2 2.9 7.2 11.1% 1 4.17s 624 21 0
汎用知能 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 4.2 9.9 0.0% 0 23.23s 498 76 3,782
DeepSeek V3.2 4.7 1.6 66.7% 1 9.32s 314 43 0
指示追従 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 9.8 10.0 100.0% 0 11.60s 508 64 2,842
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 627 66 0
パズル解決 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 3.6 7.2 22.2% 1 12.83s 561 189 5,808
DeepSeek V3.2 7.6 7.2 77.8% 1 6.91s 424 298 0
ツール呼び出し スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 10.0 10.0 100.0% 0 11.19s 3,505 133 294
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 8,319 522 0
雑学 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 3.0 10.0 0.0% 0 36.98s 153 9 6,863
DeepSeek V3.2 3.0 10.0 0.0% 0 17.23s 183 17 0

クイック比較

比較ペアを切り替え