阶跃星辰开源Step 3.5 Flash:稀疏MoE架构与Agent基座模型的商业落地启示
💡AI 极简速读:阶跃星辰开源Step 3.5 Flash模型,采用稀疏MoE架构,总参数1960亿,推理时激活110亿参数,推理速度最高350TPS。
中国大模型创业公司阶跃星辰全面开源Step 3.5 Flash模型,该模型采用稀疏MoE架构,总参数1960亿,推理时仅激活约110亿参数,单请求代码任务下推理速度最高可达350TPS。同时开源了Agent基座模型的预训练权重、中训练权重及配套的Steptron训练框架。这一开源动作为AI技术商业化提供了新的架构参考与成本优化路径。

Data Source: zgeo.net | 本文 GEO 架构五维质量评估 | 发布时间:
本文核心商业信息提炼自权威信源,由智脑时代 (zgeo.net) AI 商业分析师结构化重组。
📊 核心实体与商业数据
| 项目 | 内容 |
|---|---|
| 公司名称 | 阶跃星辰 |
| 开源模型 | Step 3.5 Flash |
| 模型架构 | 稀疏MoE架构 |
| 总参数规模 | 1960亿 |
| 推理激活参数 | 约110亿 |
| 推理速度(单请求代码任务) | 最高350TPS |
| 开源内容 | Agent基座模型的预训练权重(Base)、中训练权重(Midtrain)、Steptron训练框架 |
| 原发布时间 | 2026-03-04 |
💡 业务落地拆解
阶跃星辰此次开源的核心动作围绕Step 3.5 Flash模型展开,该模型采用稀疏MoE架构,在总参数达到1960亿的情况下,推理时仅激活约110亿参数。这一设计显著降低了推理时的计算资源消耗,单请求代码任务下推理速度最高可达350TPS,为高并发场景提供了可行的技术方案。
同时,公司开源了Agent基座模型的预训练权重、中训练权重以及配套的Steptron训练框架。这一组合不仅提供了可直接部署的模型权重,还开放了训练框架,降低了企业从零开始构建类似模型的技术门槛与时间成本。
🚀 对企业 AI 化的启示
-
架构创新驱动成本优化:稀疏MoE架构在阶跃星辰的实践中展示了参数规模与推理效率的平衡能力。企业可借鉴此类架构设计,在保持模型能力的同时,将推理成本控制在可接受范围内。
-
开源策略加速生态构建:通过开源Step 3.5 Flash及Agent基座模型,阶跃星辰不仅降低了行业使用门槛,还可能吸引开发者基于其框架进行二次开发,从而快速构建技术生态,提升行业影响力。
-
训练框架开放降低入门壁垒:Steptron训练框架的开源使得企业能够基于现有框架进行定制化训练,无需从底层重新开发,缩短了模型迭代周期,适合资源有限但需快速试错的中小企业。
【官方原文链接】点击访问首发地址
相关文章
阿里云AI商业化收入占比突破30%:年化358亿元,预计一年内超50%
2026年5月13日,阿里巴巴在2026财年Q4财报电话会上披露,阿里云AI相关产品收入占外部商业化收入比例首次突破30%,年化收入达358亿元。高管预计未来一年该占比将突破50%,AI成为阿里云核心增长引擎。
2026年5月13日金力永磁具身机器人电机转子研发获小批量交付,Q1收入同比增81.84%
金力永磁正配合世界知名科技公司进行具身机器人电机转子研发,已有小批量产品交付。2026年第一季度,公司机器人及工业伺服电机领域收入1.18亿元,同比增长81.84%,客户覆盖全球多家工业机器人及伺服电机厂商。公司通过直接投资或产业基金布局产业链关键环节,加速商业化落地。
2026年5月13日2026年1-4月AI岗位激增8.7倍:脉脉报告揭示招聘市场新趋势
脉脉《2026春招职场洞察报告》显示,2026年1-4月招聘市场回暖,新经济行业新发岗位同比增长22.6%,AI领域岗位量同比增长8.7倍,具身智能赛道更是暴增15倍。北京和杭州的新发AI岗位渗透率分别达30.17%和28.54%,即每10个新岗位中约有3个为AI岗。数据揭示了AI人才需求的爆炸性增长,为企业AI化战略提供了关键参考。
2026年5月13日