Anthropic: Claude Opus 4.7 vs Tencent: Hy3 preview
Samenvatting
Benchmarkvergelijking Claude Opus 4.7 vs Hy3 preview: Claude Opus 4.7 leidt in gemiddelde score met 8.7 vs 6.8. Hy3 preview heeft lagere benchmarkkosten met $0.059 vs $0.679. Claude Opus 4.7 is sneller met 4.73s vs 56.57s, met slagingspercentages van 82.5% vs 55.6%.
Aanbevolen model: Claude Opus 4.7 - Het heeft hier de beste score (8.7) en reageert ongeveer 12.0x sneller dan Hy3 preview.
Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-06-18
Hy3 previewHy3 previewhighGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.Releasedatum: 2026-04-22
Score
8.7Gemiddelde score over alle benchmarktests.…
6.8Gemiddelde score over alle benchmarktests.…
Rang
#13
#74
Betrouwbaarheid
10.0Succescore bij de eerste poging: 10.0 betekent geen herhaalbare doel-API- of snelheidslimietfouten vóór succesvolle calls; geregistreerde fouten verlagen de score.…
10.0Succescore bij de eerste poging: 10.0 betekent geen herhaalbare doel-API- of snelheidslimietfouten vóór succesvolle calls; geregistreerde fouten verlagen de score.…
Consistentie
9.6Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
9.2Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
Correcte tests
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 3Time-out: 1Responstijd (gem.)4.73sResponstijd (max)23.18sResponstijd (totaal)94.51sEen test is alleen volledig geslaagd als alle runs slagen.…
Een test is alleen volledig geslaagd als alle runs slagen.API-fout: 7Verkeerd antwoord: 3Responstijd (gem.)56.57sResponstijd (max)149.94sResponstijd (totaal)848.59sEen test is alleen volledig geslaagd als alle runs slagen.…
Slaagpercentage per poging
82.5%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
55.6%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
Instabiele tests
1Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
2Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Totaal runs
63Totaal runs…
63Totaal runs…
Kosten per resultaat
3.991Toont de gemiddelde kosten per correct benchmark-antwoord in centen (lager is beter).…
0.000Toont de gemiddelde kosten per correct benchmark-antwoord in centen (lager is beter).…
Totale kosten
$0.679Totale kosten (huidige prijs)…
$0.059Totale kosten (huidige prijs)…
Invoerprijs
$5.000 / 1MInvoerprijs…
$0.066 / 1MInvoerprijs…
Uitvoerprijs
$25.000 / 1MUitvoerprijs…
$0.260 / 1MUitvoerprijs…
Totaal aantal invoer-tokens
65,406Totaal aantal invoer-tokens…
25,987Totaal aantal invoer-tokens…
Uitvoer-tokens
11,858Uitvoer-tokens…
216,719Uitvoer-tokens…
Redeneer-tokens
2,198Redeneer-tokens…
0Redeneer-tokens…
Responstijd (gem.)
4.73sResponstijd (gem.)…
56.57sResponstijd (gem.)…
Responstijd (max)
23.18sResponstijd (max)…
149.94sResponstijd (max)…
Responstijd (totaal)
94.51sResponstijd (totaal)…
848.59sResponstijd (totaal)…
Generatie-showcase
Hamster playing table tennis
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
#13 Claude Opus 4.7
medium
Kosten
$0.059
Tijd
26.8s
Tokens
2,475 tok
#74 Hy3 preview
high
Hy3 preview is no longer available as a free model. It has transitioned to a paid model. Continue using it here: https://openrouter.ai/tencent/hy3-preview
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
75.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)1.85sResponstijd (max)2.71sResponstijd (totaal)7.38sEen test is alleen volledig geslaagd als alle runs slagen.…
1.85sResponstijd (gem.)…
894Totaal aantal invoer-tokens…
348Uitvoer-tokens…
0Redeneer-tokens…
Hy3 previewGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
6.4Gemiddelde score over alle benchmarktests.…
7.9Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
58.3%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
1Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.API-fout: 2Responstijd (gem.)15.12sResponstijd (max)19.99sResponstijd (totaal)45.37sEen test is alleen volledig geslaagd als alle runs slagen.…
7.2Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
77.8%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
1Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)12.96sResponstijd (max)23.18sResponstijd (totaal)38.89sEen test is alleen volledig geslaagd als alle runs slagen.…
12.96sResponstijd (gem.)…
10,635Totaal aantal invoer-tokens…
7,629Uitvoer-tokens…
1,114Redeneer-tokens…
Hy3 previewGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
5.3Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
33.3%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.API-fout: 2Responstijd (gem.)99.76sResponstijd (max)99.76sResponstijd (totaal)99.76sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)21.45sResponstijd (max)21.45sResponstijd (totaal)21.45sEen test is alleen volledig geslaagd als alle runs slagen.…
21.45sResponstijd (gem.)…
24,501Totaal aantal invoer-tokens…
2,369Uitvoer-tokens…
1,084Redeneer-tokens…
Hy3 previewGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
10.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)113.09sResponstijd (max)113.09sResponstijd (totaal)113.09sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.37sResponstijd (max)3.30sResponstijd (totaal)4.74sEen test is alleen volledig geslaagd als alle runs slagen.…
2.37sResponstijd (gem.)…
10,533Totaal aantal invoer-tokens…
324Uitvoer-tokens…
0Redeneer-tokens…
Hy3 previewGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
6.5Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
50.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.API-fout: 1Responstijd (gem.)12.11sResponstijd (max)12.11sResponstijd (totaal)12.11sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
66.7%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Responstijd (gem.)1.17sResponstijd (max)1.40sResponstijd (totaal)2.35sEen test is alleen volledig geslaagd als alle runs slagen.…
1.17sResponstijd (gem.)…
630Totaal aantal invoer-tokens…
51Uitvoer-tokens…
0Redeneer-tokens…
Hy3 previewGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
5.3Gemiddelde score over alle benchmarktests.…
7.2Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
44.4%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
1Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)109.04sResponstijd (max)149.94sResponstijd (totaal)327.11sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.87sResponstijd (max)2.87sResponstijd (totaal)2.87sEen test is alleen volledig geslaagd als alle runs slagen.…
2.87sResponstijd (gem.)…
723Totaal aantal invoer-tokens…
256Uitvoer-tokens…
0Redeneer-tokens…
Hy3 previewGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
3.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
0.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.API-fout: 1Responstijd (gem.)0msResponstijd (max)0msResponstijd (totaal)0msEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)1.57sResponstijd (max)1.66sResponstijd (totaal)3.14sEen test is alleen volledig geslaagd als alle runs slagen.…
1.57sResponstijd (gem.)…
939Totaal aantal invoer-tokens…
114Uitvoer-tokens…
0Redeneer-tokens…
Hy3 previewGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
10.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)34.36sResponstijd (max)41.83sResponstijd (totaal)68.73sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.43sResponstijd (max)2.89sResponstijd (totaal)7.28sEen test is alleen volledig geslaagd als alle runs slagen.…
2.43sResponstijd (gem.)…
939Totaal aantal invoer-tokens…
370Uitvoer-tokens…
0Redeneer-tokens…
Hy3 previewGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
7.7Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
66.7%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.API-fout: 1Responstijd (gem.)27.94sResponstijd (max)45.06sResponstijd (totaal)55.89sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.17sResponstijd (max)4.17sResponstijd (totaal)4.17sEen test is alleen volledig geslaagd als alle runs slagen.…
4.17sResponstijd (gem.)…
15,339Totaal aantal invoer-tokens…
373Uitvoer-tokens…
0Redeneer-tokens…
Hy3 previewGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
10.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)78.83sResponstijd (max)78.83sResponstijd (totaal)78.83sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
0.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)2.25sResponstijd (max)2.25sResponstijd (totaal)2.25sEen test is alleen volledig geslaagd als alle runs slagen.…
2.25sResponstijd (gem.)…
273Totaal aantal invoer-tokens…
24Uitvoer-tokens…
0Redeneer-tokens…
Hy3 previewGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
3.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
0.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)47.71sResponstijd (max)47.71sResponstijd (totaal)47.71sEen test is alleen volledig geslaagd als alle runs slagen.…