当前智算时代背景下,固件技术作为智算时代的核心底座,其创新与生态融合正成为行业发展的关键引擎。2025年9月26日,由固件产业技术创新联盟、阿里云、凌思微电子联合主办,中国电子技术标准化研究院、集成电路测试与评价工业和信息化部重点实验室合作支持的《2025固件技术论坛暨BMC技术创新生态论坛》,在杭州·云栖大会盛大启幕。这场以“智算新时代:固件技术的创新与生态融合”为主题的行业盛会,汇聚政产学研多方力量,带来固件与BMC技术领域的思想盛宴与前沿探索。
本次论坛由固件产业技术创新联盟秘书长尹航主持,工业和信息化部电子信息司电子系统处金磊处长、中国电子技术标准化研究院郭楠副院长出席论坛并致辞。会上发布了《新一代 AI 服务器管理芯片(BMC)技术方案》,为三家通过 BIOS/BMC 标准符合性测试的厂商颁发了证书。
金磊处长在发言中对产业发展提出了指导建议,他提出要锚定国家战略需求夯实安全发展底座、聚焦核心技术攻坚筑牢自主可控根基、深化产业协同创新构建良性发展生态,期待产学研用各方携手推动 BMC 与固件产业发展,为国家算力基础设施安全及数字经济高质量发展贡献力量。
郭楠副院长指出固件在智算时代是驱动产业发展的关键力量,也面临技术、安全等方面的挑战与机遇,强调标准化对产业赋能升级的重要性并提出三点建议,推动标准化与产业深度融合以解决产业痛点、坚守自主可控底线并积极参与国际标准化合作、以产业联盟和标准化组织为平台加强产业协同构建完善生态。
中国电子技术标准化研究院技术总监钟伟军博士解读了《新一代AI服务器管理芯片(BMC)技术方案》,并深入剖析新一代BMC技术方案的核心要点、技术优势与以及落地实践路径,为行业技术发展提供标准与方向指引。随后,方案的发布标志着新一代AI服务器管理芯片(BMC)相关行动计划的正式开启,推动技术方案落地实践,加速行业技术创新与应用。
《新一代 AI 服务器管理芯片(BMC)技术方案》正式发布暨行动计划启动仪式作为本场论坛的高潮环节,凭借超权威嘉宾阵容与里程碑式意义,将现场气氛推向顶峰。在全场嘉宾的共同见证下,中国电子技术标准化研究院副院长郭楠、固件产业技术联盟秘书长尹航、清华大学集成电路学院副院长姜汉钧、北大高等信息研究院院长蒋云、阿里云智能固件技术负责人李羿、凌思微电子 CEO 王江伟六位嘉宾共同登台,代表政产学研用全链条力量,正式揭晓这份凝聚行业顶尖智慧的技术方案。随后,六位嘉宾共同将手按向启动屏,伴随灯光与掌声,行动计划正式启动,标志着国产 BMC 技术从 “单点技术突破” 进入 “全产业链协同推进” 的新阶段。
现场举行标准符合性测试证书颁发仪式,天翼云、华为、安迈等3家企业成为通过 BIOS/BMC 标准符合性测试并获得证书。中国电子技术标准化研究院技术总监钟伟军博士表示,标准化工作通过统一技术规范、优化流程体系,消除行业壁垒,提升协同效率,标筑牢质量根基、增强创新动能,引领产业向高端化、智能化、绿色化演进。这对固件领域符合行业标准的企业与技术进行权威认可。见证了固件技术标准化进程的重要成果,为主办方推动行业合规发展、引导技术高质量落地提供实践支撑。
《新一代 AI 服务器技术和 BMC 管理体系特点》圆桌讨论由中国电子技术标准化研究院技术总监钟伟军主持,凌思微电子 CEO 王江伟、阿里云计算 BMC 架构师王魁英、天翼云固件专家刘宇、昆仑太科 BMC 业务负责人王亚洲、苑方五位嘉宾参与,围绕 AI 服务器技术趋势与 BMC 管理体系创新展开深度对话;钟伟军首先抛出 “AI 服务器规模化部署下,BMC 芯片如何在保障高性能的同时,平衡成本控制与多场景兼容性” 的核心议题,王江伟结合凌思微电子近三年量产实践回应,提出需通过 “架构创新 + 场景定制” 双路径破局,并以 LS102X 芯片为例说明技术方案,还透露联合固件产业技术联盟制定 “BMC 芯片兼容性测试标准”;针对钟伟军提出的 “未来 3-5 年,BMC 芯片技术将面临哪些核心变革,企业应如何提前布局” 这一关键话题,王江伟从技术层面预判 “AI 原生”“安全可信”“多模态管理” 三大趋势,从产业生态层面强调需构建 “高校研发 + 企业转化 + 联盟推广” 的协同生态,并介绍凌思微的相关布局;随后王魁英认可凌思微在 RISC-V 架构上的实践并提出合作意向,刘宇建议增加运营商级别的远程运维加密方案,王江伟积极回应表示凌思微已预留安全接口,未来将推动跨企业技术标准协同。
在论坛的主题演讲环节,来行业顶尖机构的专家轮番带来精彩演讲,从行业实践、BMC芯片技术、技术标准构建,社区合作共赢,以及技术生态孵化等角度,分别带来多场精彩分享。
阿里云 BMC 架构师、OpenBMC 社区管理员王魁英分享了 LittleBMC 在阿里云 AI 异构服务器的应用实践。介绍LittleBMC 芯片 CMU610 历经三年实现从设计到回片一版成功,集成 Flash、ROT,ADC 和 I3C 数量翻倍,相比传统方案集成度提升 80%、功耗降低 70%、面积减小 60%、监控能力提升 10%+;随后说明 Zephyr-Based OpenBMC CoreLynxV6 成功运行到 CMU610,其软件架构中 APP 层完全兼容 Linux-Based OpenBMC,Bus 和中间件完成适配,代码架构以 Yocto 为基础融入 OpenBMC 框架,还建议 OpenBMC 社区与 Zephyr 社区组建对应工作组促进融合;最后展示 Zephyr-Based OpenBMC 与 CMU610 结合在阿里云服务器的落地实践,呈现了相关运行日志等应用情况。
王江伟围绕 AI 智算时代 BMC 芯片展开分享,指出 AI 服务器推动 BMC 从传统监控芯片升级为关键神经中枢,同时面临四大核心挑战:一是系统管理复杂度攀升,监控对象大幅扩展,单柜 350kW 高功耗需毫秒级精准调控,且液冷场景下需实现多维度状态监控;二是海量固件协同难度加大,需满足多类固件批量刷新需求;三是安全防护压力显著增加,需构建多重防护体系保障运行安全;四是成本与空间双重约束,管理芯片用量提升但板级安装空间有限。
针对这些挑战,以 “全功能 Big BMC + 轻量化 LiteBMC” 组合模式,根据不同系统需求灵活适配,可有效实现降本、降耗、提效三重目标。同时介绍凌思微两款核心产品:全功能 BMC 基于 RISC-V 架构开发,支持全场景功能与国产化 IP;轻量化 LiteBMC 采用 DDR-less 设计,搭配独创 Z-BUS 层技术加速落地应用,且两款芯片均具备全链路安全保障能力。
最后,他展望 BMC 芯片未来发展方向,包括深化芯云协同开发、借助 AI 赋能实现智能化升级(如结合大模型提升故障预测能力)、推进先进工艺迭代与安全体系优化,清晰呈现 BMC 从被动监控向主动智能管理的转型路径,以及凌思微的全方位芯片解决方案。
清华大学集成电路学院副院长姜汉钧从学术视角出发,初探基于OpenBMC的服务器智能散热技术。服务器散热是保障AI服务器稳定运行的关键,姜汉钧结合学术研究与行业需求,分析OpenBMC在智能散热领域的潜力与应用前景,为技术创新提供学术支撑。
微纳芯联联合创始人兼副总裁王佳鑫带来关于三维存算一体大模型推理芯片的分享。存算一体技术是固件与芯片领域的前沿方向,王佳鑫介绍3D - CIM™大模型推理芯片的技术特点与优势,以及在AI大模型推理场景中的应用潜力,展现固件技术与芯片技术融合的前沿成果。
天翼云固件专家刘宇阐述以BMC为核心构建高RAS(可靠性、可用性、可维护性)特性数据中心架构的理念与实践。数据中心对稳定性与可维护性要求极高,刘宇分享如何通过BMC技术优化数据中心架构,提升其RAS特性,保障数据中心高效稳定运行。
联想ISG中国区UEFI开发高级经理曹光曙分享云固件的实践经验与未来展望。联想在云领域布局广泛,曹光曙结合联想的云固件实践,探讨云固件技术的发展现状与趋势,为云时代的固件技术发展提供参考。
张新天分享 LiteBMC LS102X 的创新亮点时指出,当前 AI 服务器呈现两大趋势:一是 BMC 数量配置升级,形成 “1 个带 KVM 功能 + N 个无 KVM 功能” 的组合模式;二是平台固件安全标准持续提高。围绕这一趋势,聚焦核心产品 LiteBMC LS1020:该芯片采用 RV32GCP 架构,不仅具备低功耗优势,还支持双工作模式,同时搭载多重安全特性,可适配 AI 服务器对管理芯片的基础需求。并提及具备多接口适配能力的 FullBMC,进一步展现凌思微产品矩阵在功能覆盖上的多元化支撑力。针对 AI 服务器日益提升的安全需求, PFR 系列产品内置 FLASH 存储,配备多组 Filter 功能,能针对性强化平台安全防护,为服务器底层固件安全提供保障。
阿里云谢崎森、梅建强分享 CMU610 固件应用实践:谢崎森介绍基于 Zephyr 的 OpenBMC 架构,以 “应用层 + 适配层 + 内核层” 框架实现核心组件无缝移植,兼具兼容、灵活、安全优势,资源需求远低于传统架构,还支持低代码开发与轻量化部署;梅建强阐述 BMC 可信计算,指出 CMU610 通过硬件隔离设计构建全栈防护体系,覆盖安全启动、升级、通信等功能,并展望未来方向以构建 BMC 可信生态。
昆仑太科王亚洲分享轻量级带外管理方案:先指出边缘设备运维(带内管理存数据风险、OS 崩溃需现场处理等)与板卡管理的问题,说明轻量级管理模块通过精简硬软件功能,为边缘设备融入带外远程运维能力,同时提及服务器 BMC 的集中管理核心作用;接着阐述方案的设计(选型、特性、架构);最后展示基于凌思微 LS1020 的应用案例,介绍硬件接口配置,及方案实现的资产管理、远程控制、故障诊断等功能,还提及支持的 IPMI 命令与 Web 页面管理。
河南昆仑王钦东分享 openUBMC 于 AI 基础设施可靠性运维的应用实践:能效管理上,用 MPC-PID 算法等动态调优,优化功耗并提供节能评估与策略;硬盘故障管理上,实时采数据结合模型提前 7-30 天预测风险盘,降故障率减人力;内存故障管理上,建多级 RAS 保护体系,借模型实现预测,故障定界定位成功率超 95%,还提 DDR5 自愈功能;光模块管理上,检测问题并提前 24+h 预警老化,主动处置以提运维效率。
聿宁科技李龙壮在云栖大会分享服务器 / 云与边缘计算场景的 BMC 固件架构融合实践:先介绍公司定位,提及为芯片提供全阶段固件产品服务,获飞腾认证且相关 BIOS 软件商用,还完成 RISC-V 架构 BIOS 部署;再分析业界现状,指出服务器 / 云场景传统 BMC 的不足及 OpenBMC 等开源方案的优势,边缘场景传统设备运维痛点与边缘 BMC 的局限;随后提出融合方案,通过跨平台中间件层与 YNMsgBus 消息中间件,实现跨场景无缝切换与功能共享;最后分享固件技术发展思考,指出计算架构变化、国产化替代等机会,建议持续创新并结合客户场景创造价值。
苑方分享 OCP 硬件故障管理工作组最新进展:先指出未来 RAS 设计需适配不同场景,AI 服务器故障率高且组件错误管理不统一,亟需统一错误上报机制;接着介绍 OCP 硬件故障管理子项目(目标解决数据中心故障管理痛点,含明确需求、规范行为等,附项目链接);随后详解 OCP RAS API(标准接口,最新规范 0.80 版,推进 1.0 版,明确目标与核心功能)。
论坛总结与展望,锚定未来方向
论坛最后,对全天精彩内容进行总结与展望。回顾各位嘉宾的分享要点,梳理固件与BMC技术创新与生态融合的核心观点,同时展望行业未来的发展趋势与方向,为与会者带来对行业发展的整体认知与长远期待。
这不仅是技术交流的平台,更是产业协作的桥梁。此次论坛的成功举办为行业内人士搭建了高效的交流平台,促进了技术创新与产业协作,对推动固件技术及 BMC技术的持续发展、助力BMC国产化进程具有重要意义。随着帷幕落下,这场汇聚行业智慧与前沿技术的论坛,为固件与BMC技术领域的发展注入新的活力与动力。无论你是行业从业者、技术研究者还是生态合作伙伴,都能在这场论坛中找到收获与启发,共同探索智算新时代固件技术的创新与生态融合之路!