9月24日至26日,以“云智一体·碳硅共生”为主题的2025云栖大会在杭州隆重召开,展现当下AI自主行动阶段,AI云技术蓬勃发展,渗透千行百业、真实世界的壮美画卷。瑞芯微电子股份有限公司(展位号:3-16H)携多款创新芯片与端侧AI解决方案深度参与,重点展示了首颗端侧大算力协处理器RK182X、新一代4K视觉处理器RV1126B,以及具身智能机器人核心方案,成为展会中备受关注的硬科技焦点。

RK182X是瑞芯微在第九届开发者大会首度发布的协处理器芯片,具备高算力、高带宽等特性,专为端侧大模型应用设计。该芯片采用专为AI设计的NPU架构,支持通过PCIe高速接口与主SoC协同工作,并内置高带宽DRAM,可显著提升大模型在终端设备上的本地推理效率。用户还可根据实际算力需求灵活叠加多个RK182X,极大增强了端侧AI部署的适应性与扩展性。

瑞芯微和阿里云深度合作,在RK1828、RV1126B平台上完成通义千问0.6B~7B的大模型端侧部署,可实现离线状态下即时且精准的多轮人机对话问答以及视频分析。未来,双方将携手打造面向应用开发者和终端设备厂商的生成式AI软硬件生态,基于瑞芯微平台适配更多参数版本的通义大模型,共同探索面向大众的AI智能体(AI Agent)服务场景新机遇。

瑞芯微产品总监Kever Yang在本次云栖大会的主题演讲中表示,端侧大模型正引领 AIoT2.0 变革。当前模型呈 “同等尺寸下性能跃升化” 发展,端侧硬件算力与带宽同步提升。瑞芯微未来坚持“主控 + 协处理器” 芯片路线,以RK182X系列为代表的算力协处理器芯片以 3D 堆叠 DRAM 突破带宽瓶颈,实现百GB级带宽,覆盖多模态任务。在端云结合的方案下,赋能安防、教育、办公、机器人等场景,实现低延时、高隐私的AI应用,全面提升智能设备体验。

在性能层面,RK1828(RK182X系列中的旗舰型号)表现尤为突出。在运行Qwen 2.5-7B大模型时,首帧延迟控制在160毫秒左右,每秒可生成50+个Token(TPS),性能处于行业领先水平。现场还展示了基于RK1828 端侧运行通义千问3B VLM,每秒生成Tokens达80+ TPS,可以实时、准确的分析摄像头画面内容。RK3576+RK1820同声传译系统及虚拟数字人方案,全面体现其在高并发、复杂场景下的可靠算力支撑。

同时亮相的新一代4K视觉处理器RV1126B,集成3TOPS强劲算力,可流畅运行2B参数规模以内的大语言与多模态模型。在现场展示了基于RV1126B的端云协同方案,即端侧运行通义千问端侧0.6B的ViT视觉大模型,云端LLM,可以实现本地脱敏上传,隐私合规,成本较云端可以降低一半以上。该芯片搭载定制AI-ISP架构,支持动态拼接、数字防抖、超级编码、AI Remosaic、AOV3.0低功耗等先进处理技术,并强化了硬件安全机制,适用于智能安防摄像头、复杂机器视觉系统、智能车载设备、机器人等高要求场景。

展会中特别演示的红外热成像(IRFPA)方案,最大支持 16bit 数据输入,支持包括OCC(探测器像素偏置校正)、自动NUC(非均匀性校正)、去横竖条纹、3D及2D降噪、动态范围压缩等在内的多个功能,广泛应用于安防监控、工业检测、医疗诊断、消费电子等领域,进一步拓展了其在多元环境下的应用潜力。

具身智能作为下一代新质生产力的关键载体,正深刻重塑制造与服务领域的效率范式。瑞芯微展出了基于具身智能机器人/机器狗的RK MotionCore核心方案。该方案依托RK3588芯片强大的Hybrid计算架构,充分发挥CPU、GPU和NPU的协同算力,实现高帧率强化学习控制策略部署,可完成多种高难度动态动作的实时生成与执行,展现了端侧智能向运动决策和环境交互延伸的技术突破。

云栖大会不仅是技术创新的展示平台,更是产业与生态共创的桥梁。瑞芯微通过此次展会,全面呈现了在端侧AI、具身智能与新质生产力融合中的深度布局与技术积累。在AIoT 2.0时代,端侧算力正成为推动智能普及的关键基石,而具身智能则昭示着人机共融、虚实联动的未来方向。瑞芯微将持续聚焦底层硬件创新与开放生态建设,与行业伙伴共同推进端侧大模型与智能体技术的规模化落地,赋能百业数字化转型,助力新质生产力真正扎根于场景、服务于未来。