
克雷西 发自 凹非寺
量子位 | 公众号 QbitAI
开源模子王座再次易主,依旧是国产模子!
不外之前霸榜的DeepSeek和Qwen来自杭州,当今变成上海的Minimax了。
在第三方评测机构Artificial Analysis的测试中,Minimax M2以61分得到了开源模子第一,紧随Claude 4.5 Sonnet。

官方先容,Minimax M2专为智能体和编程而生,编程才融合Agent进展出众。
况且经济高效,推理速率是Claude 3.5 Sonnet的两倍,API价钱却只须8%。
Minimax示意,智能水平、速率和资本在往常被视为“不行能三角”,但跟着M2的出世,这个三角被冲破了。
目下,M2的完满模子权重仍是开源,弃取MIT契约,在线Agent平台和API也限时免费。

8%资本收尾Claude级水平
Minmax M2是一个稀少度较高的MoE模子,总参数目230B,激活参数目仅有10B。
网友示意10B的激活参数运行起来会格外快,如若配上Cerebras或者Groq这么的推理加快平台,有望跑到每秒上千Token。
另一个特质是弃取了交错的想维体式,使得模子概况贪图和考据跨多个对话的操作步调,这关于Agent推理至关焦炙。
如滥觞先容,Minimax官方将M2界说为一个专为智能体和编程而生的模子。
它专为端到端竖立使命历程而构建,况且进展出对复杂、长链器用调用任务的出色贪图和褂讪履行才调,维持Shell、浏览器、Python代码证据器和种种MCP器用的调用。
在Agent最要道的三个才调——编程才调、器用使用才融合深度搜索才调上,M2在器用使用和深度搜索方面上皆不逊于国外顶尖模子,编程才调也在国内名列三甲。
概括进展上,M2在Artificial Analysis的测试中,得到了总名顺次五、开源第一的得益。
该测试使用了10个热点数据集,包括MMLU Pro、GPQA Diamond、东说念主类临了测试、LiveCodeBench等。
而M2的订价是0.3好意思元/2.1东说念主民币每百万输入Token,1.2好意思元/8.4东说念主民币每百万输出Token,只须Claude 3.5 Sonnet的8%。
以Artificial Analysis的得益为基准,Minimax画图了一张图来比较各大模子性价比(横轴越向右资本越低)。
在线推理就业的速率则可达每秒100Token,Minimax也画了一张图体现以速率测度的性价比。
同期,Minimax团队还针对智能体、全站竖立和Terminal Use三项任务对M2和其他模子进行了一双一比拼。
放荡M2比拟于Claude Sonnet 4.5、GLM 4.6、Kimi-K2以及DeepSeek V3.2均有极高的Win+Tie比例,同期资本格外便宜。
为了更直不雅地体现M2的Agent才调,Minimax仍是把M2部署到了Agent平台,限时免费使用,按官方说法,免费期直到就业器扛不住为止。
同期在该平台上,也展示了许多Minimax Agent的现成作品。
Minimax Agent:能写圭臬,还会作念PPT诳骗Minimax的Agent平台,可以写出种种各样的网页或在线应用。
固然像好多经典游戏,也皆能用它在Web环境当中复刻并班师部署。
以致有网友创作的在线五子棋游戏平台,不仅有游戏骨子,还引入了在线对战、不雅战、在线聊天,以致是用户注册等功能。
除了编程,也可以生成种种主题的调研通告或者PPT。
在X上,也有网友展示了我方用M2 Agent编程的实战后果,仅通过三轮反应就完成了一个足球小游戏的制作。
可以说效果格外可以。
模子进展以外,M2使用的扎眼光机制,也激勉了网友们的征询。
羼杂扎眼光vs全扎眼光有网友从vllm的代码当中看出了M2的更多本事细节,示意M2弃取肖似GPT-OSS的全扎眼光和滑动窗口扎眼光(SWA)的羼杂机制,
不外Minimax NLP崇敬东说念主指正,示意一运行确乎想在预纯熟阶段引入SWA,但发现会形成性能赔本,是以临了使用的是全扎眼光。
Falcon团队的本事东说念主员看了之后示意,他们在纯熟模子的时候也发现了相同的气候,SWA羼杂扎眼光会镌汰模子性能,这和一些论文的考虑不符。
在部分论文和实践中,SWA在提高效力的同期可以保执性能,如Mistral和谷歌Gemma模子的关连考虑均维持此不雅点。
但Minimax的推行测试涌现其在长程依赖任务上存在局限。
同期,M2也莫得弃取Lightning Attention(线性扎眼光的一种变体),原因亦然因为性能赔本。
相同与之相背,有论文目的线性扎眼光在长序列任务中更具上风。
到底哪种途径更优,可能照旧要看具体需求,但至少从M2的进展上看,Minimax弃取果涌现是一种合乎我方的面貌。
Agent平台:https://agent.minimax.io
Hugging Face:https://huggingface.co/MiniMaxAI/MiniMax-M2参考流通:[1]https://www.minimax.io/news/minimax-m2[2]https://venturebeat.com/ai/minimax-m2-is-the-new-king-of-open-source-llms-especially-for-agentic-tool[3]https://x.com/jessi_cata/status/1982936050256490968[4]https://x.com/JingweiZuo/status/1982822979030692356— 完 —
量子位 QbitAI
关切咱们开yun体育网,第一时间获知前沿科技动态
