North Mini Code (medium) vs GPT-5.4

排名: #159
总输出令牌: 1,766,801
响应时间（平均）: 137.11s
总成本: $0.000

排名: #161
总输出令牌: 8,321
响应时间（平均）: 2.07s
总成本: $0.397

推荐模型 GPT-5.4

它的得分接近这里的最高分（5.8 vs 5.9），同时响应速度比North Mini Code (medium)快约 66.3 倍。

详细对比

指标	North Mini Code North Mini Code medium 发布日期: 2026-06-18 免费可用	GPT-5.4 GPT-5.4 none 发布日期: 2026-03-05

指标	North Mini Code North Mini Code medium 发布日期: 2026-06-18 免费可用	GPT-5.4 GPT-5.4 none 发布日期: 2026-03-05
分数	5.9	5.8
排名	#159	#161
可靠性	8.6	10.0
一致性	8.5	9.2
基准测试覆盖率	22/22 项测试 · 58/66 次尝试	22/22 项测试 · 66/66 次尝试
测试正确
尝试通过率	48.5%	34.9%
不稳定测试	4	2
总运行次数	58	66
每个结果成本	0.000	5.663
总成本	$0.000	$0.397
输入价格	$0.000 / 1M	$2.500 / 1M
输出价格	$0.000 / 1M	$15.000 / 1M
总输入令牌	81,813	108,632
输出令牌	424,772	8,321
推理令牌	1,342,029	0
响应时间（平均）	137.11s	2.07s
响应时间（最大）	786.72s	15.63s
响应时间（总计）	3016.42s	45.51s

模型生成展示

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#159 North Mini Code

medium

成本: $0.000
时间: 51.8s
令牌: 12,460 tok

#161 GPT-5.4

none

成本: $0.026
时间: 18.1s
令牌: 1,792 tok

按分数排名的模型

分数 vs 总成本

响应时间（平均）

分数 vs 响应时间（平均）

总输出令牌

分数 vs 总输出令牌

类别细分

类别:

反AI技巧	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
North Mini Code	8.4	10.0	75.0%	0		64.79s	324	64,441	68,535
GPT-5.4	3.2	8.0	8.3%	1		1.21s	606	406	0

编程	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
North Mini Code	4.5	4.9	33.3%	2		320.43s	7,119	219,891	561,569
GPT-5.4	5.5	10.0	33.3%	0		1.62s	7,305	516	0

综合	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
North Mini Code	2.9	5.8	16.7%	1		554.89s	63,682	0	472,040
GPT-5.4	3.0	10.0	0.0%	0		9.26s	85,439	6,195	0

数据解析与提取	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
North Mini Code	10.0	10.0	100.0%	0		24.06s	6,819	240	2,659
GPT-5.4	10.0	10.0	100.0%	0		1.04s	7,140	222	0

领域专项	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
North Mini Code	5.3	7.2	44.4%	1		71.37s	621	8,483	104,079
GPT-5.4	5.3	7.2	44.4%	1		1.07s	723	50	0

通用智能	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
North Mini Code	5.1	10.0	0.0%	0		25.08s	444	1,546	1,635
GPT-5.4	4.4	9.9	0.0%	0		1.78s	477	184	0

指令遵循	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
North Mini Code	9.8	10.0	100.0%	0		15.43s	379	909	1,339
GPT-5.4	6.5	10.0	50.0%	0		1.07s	660	81	0

谜题求解	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
North Mini Code	3.3	10.0	0.0%	0		19.70s	543	2,215	2,485
GPT-5.4	5.6	9.8	33.3%	0		1.44s	642	381	0

工具调用	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
North Mini Code	10.0	10.0	100.0%	0		3.93s	1,776	41	563
GPT-5.4	10.0	10.0	100.0%	0		2.75s	5,445	246	0

常识问答	分数	一致性	尝试通过率	不稳定测试	测试正确	响应时间（平均）	输入令牌	输出令牌	推理令牌
North Mini Code	3.0	10.0	0.0%	0		305.02s	106	127,006	127,125
GPT-5.4	3.0	10.0	0.0%	0		990ms	195	40	0

快速对比

切换对比组合

North Mini Codemedium免费可用vsGPT-5.4 Mininone Nemotron 3 Supermedium免费可用vsGPT-5.4none North Mini Codemedium免费可用vsKimi K2.6none GPT-5.4nonevsInkling Smalllow North Mini Codemedium免费可用vsGPT-5.6 Terranone KAT-Coder-Air V2.5highvsGPT-5.4none North Mini Codemedium免费可用vsGLM 5none North Mini Codemedium免费可用vsInkling Smalllow Trinity Large ThinkinglowvsNorth Mini Codemedium免费可用 Trinity Large ThinkingmediumvsGPT-5.4none North Mini Codemedium免费可用vsLing 3.0 Flashnone免费可用 North Mini Codemedium免费可用vsNemotron 3 Ultranone免费可用