ナビゲーション
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Cobuddy vs inclusionAI: Ling-2.6-flash

概要

Cobuddy vs Ling-2.6-flash の benchmark 比較: Cobuddy が平均スコアでリードし、4.9 vs 4.9 です。 Cobuddy の benchmark コストが低く、$0.000 vs $0.001 です。 Ling-2.6-flash の方が高速で、9.34s vs 39.90s です、成功率は 47.6% vs 31.8% です。

おすすめモデル: Ling-2.6-flash - スコアはここでの最高値に近く(4.9 vs 4.9)、Cobuddy より約 4.3 倍速く応答します。

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-07-02

指標 Cobuddy Cobuddy medium リリース: 2026-05-06 Ling-2.6-flash Ling-2.6-flash none リリース: 2026-04-21
スコア 4.9 4.9
順位 #145 #148
信頼性 10.0 10.0
一貫性 7.5 9.2
正解テスト
試行ごとの合格率 47.6% 31.8%
不安定なテスト 6 2
総実行回数 63 63
結果あたりのコスト 0.000 0.005
合計コスト $0.000 $0.001
入力価格 $0.000 / 1M $0.010 / 1M
出力価格 $0.000 / 1M $0.030 / 1M
合計入力トークン 37,449 40,718
出力トークン 1,677 2,878
推論トークン 116,703 0
応答時間(平均) 39.90s 9.34s
応答時間(最大) 309.02s 35.34s
応答時間(合計) 797.98s 177.48s

生成ショーケース

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#145 Cobuddy

medium
No endpoints found for baidu/cobuddy:free.
コスト
$0.000
時間
0.1s
トークン
0 tok

#148 Ling-2.6-flash

none
Ling-2.6-flash is no longer available as a free model. It has transitioned to a paid model. Continue using it here: https://openrouter.ai/inclusionai/ling-2.6-flash
コスト
$0.000
時間
0.0s
トークン
0 tok

スコア上位モデル

スコア vs 総コスト

応答時間(平均)

スコア vs 応答時間(平均)

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 8.7 7.9 91.7% 1 10.00s 453 98 4,666
Ling-2.6-flash 6.8 8.1 58.3% 1 11.81s 726 573 0
コーディング スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 3.7 6.7 22.2% 1 79.17s 4,726 358 30,138
Ling-2.6-flash 5.3 10.0 33.3% 0 11.21s 813 381 0
複合 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 3.0 10.0 0.0% 0 47.38s 18,324 465 7,265
Ling-2.6-flash 3.0 10.0 0.0% 0 35.34s 20,818 1,069 0
データ解析と抽出 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 6.3 5.8 66.7% 1 17.36s 8,181 275 5,591
Ling-2.6-flash 6.5 10.0 50.0% 0 8.48s 8,004 246 0
ドメイン特化 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 2.9 4.4 22.2% 2 128.15s 540 10 49,454
Ling-2.6-flash 3.0 10.0 0.0% 0 4.95s 810 24 0
汎用知能 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 4.2 9.9 0.0% 0 23.23s 498 76 3,782
Ling-2.6-flash 4.0 10.0 0.0% 0 1.45s 540 109 0
指示追従 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 9.8 10.0 100.0% 0 11.60s 508 64 2,842
Ling-2.6-flash 9.8 10.0 100.0% 0 5.52s 732 81 0
パズル解決 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 3.6 7.2 22.2% 1 12.83s 561 189 5,808
Ling-2.6-flash 2.9 7.2 11.1% 1 6.51s 729 151 0
ツール呼び出し スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 10.0 10.0 100.0% 0 11.19s 3,505 133 294
Ling-2.6-flash 3.0 10.0 0.0% 0 18.80s 7,324 229 0
雑学 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Cobuddy 3.0 10.0 0.0% 0 36.98s 153 9 6,863
Ling-2.6-flash 3.0 10.0 0.0% 0 1.06s 222 15 0

クイック比較

比較ペアを切り替え