AI BENCHY Compare
Arcee AI: Trinity Large Preview (free) vs Qwen: Qwen3 Coder Next
Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-03
| Métrica | Arcee AI: Trinity Large Preview (free) none Lançamento: 2026-01-27 Disponível grátis | Qwen: Qwen3 Coder Next none Lançamento: 2026-02-03 |
|---|---|---|
| Posição | #33 | #36 |
| Pontuação média | 4.34 | 3.71 |
| Consistência | 9.97 | 9.53 |
| Custo por resultado | 0.000 | 0.138 |
| Custo total | $0.000 | $0.005 |
| Testes corretos | 5/14 | 3/14 |
| Taxa de acerto por tentativa | 35.7% | 26.2% |
| Testes instáveis | 0 | 1 |
| Tokens de saída | 1,415 | 2,688 |
| Tokens de raciocínio | 0 | 0 |
Detalhamento por categoria
| Truques anti-IA | Pontuação | Consistência | Taxa de acerto por tentativa | Testes instáveis | Testes corretos | Tokens de saída | Tokens de raciocínio |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 1.00 | 10.00 | 0.0% | 0 | 587 | 0 | |
| Qwen: Qwen3 Coder Next | 2.33 | 9.99 | 0.0% | 0 | 1,315 | 0 |
| Análise e extração de dados | Pontuação | Consistência | Taxa de acerto por tentativa | Testes instáveis | Testes corretos | Tokens de saída | Tokens de raciocínio |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 9.88 | 10.00 | 100.0% | 0 | 186 | 0 | |
| Qwen: Qwen3 Coder Next | 5.50 | 10.00 | 50.0% | 0 | 276 | 0 |
| Específico do domínio | Pontuação | Consistência | Taxa de acerto por tentativa | Testes instáveis | Testes corretos | Tokens de saída | Tokens de raciocínio |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 4.00 | 10.00 | 33.3% | 0 | 21 | 0 | |
| Qwen: Qwen3 Coder Next | 4.00 | 10.00 | 33.3% | 0 | 24 | 0 |
| Seguimento de instruções | Pontuação | Consistência | Taxa de acerto por tentativa | Testes instáveis | Testes corretos | Tokens de saída | Tokens de raciocínio |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 2.00 | 9.79 | 0.0% | 0 | 63 | 0 | |
| Qwen: Qwen3 Coder Next | 4.50 | 6.88 | 33.3% | 1 | 63 | 0 |
| Puzzle Solving | Pontuação | Consistência | Taxa de acerto por tentativa | Testes instáveis | Testes corretos | Tokens de saída | Tokens de raciocínio |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 4.00 | 9.99 | 33.3% | 0 | 291 | 0 | |
| Qwen: Qwen3 Coder Next | 1.00 | 9.92 | 0.0% | 0 | 755 | 0 |
| Chamada de ferramentas | Pontuação | Consistência | Taxa de acerto por tentativa | Testes instáveis | Testes corretos | Tokens de saída | Tokens de raciocínio |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 10.00 | 10.00 | 100.0% | 0 | 267 | 0 | |
| Qwen: Qwen3 Coder Next | 10.00 | 10.00 | 100.0% | 0 | 255 | 0 |
Comparação rápida
Trocar par de comparação
Trinity Large Preview (free)noneDisponível grátisvsGLM 4.7 FlashmediumQwen3 Coder NextnonevsGLM 4.7 FlashmediumTrinity Large Preview (free)noneDisponível grátisvsQwen3 Coder NextmediumTrinity Large Preview (free)noneDisponível grátisvsMiniMax M2.5mediumTrinity Large Preview (free)noneDisponível grátisvsgpt-oss-120bmediumDisponível grátisTrinity Large Preview (free)noneDisponível grátisvsQwen3.5-FlashmediumTrinity Large Preview (free)noneDisponível grátisvsGPT-5 NanomediumTrinity Large Preview (free)noneDisponível grátisvsQwen3.5-35B-A3BmediumTrinity Large Preview (free)noneDisponível grátisvsMiMo-V2-FlashmediumClaude Opus 4.6mediumvsTrinity Large Preview (free)noneDisponível grátisTrinity Large Preview (free)noneDisponível grátisvsSeed-2.0-MinimediumMiniMax M2.5mediumvsQwen3 Coder Nextnone