English 简体中文 繁體中文 한국 사람 日本語 Deutsch русский بالعربية TÜRKÇE português คนไทย french
查看: 10|回复: 0

架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练

[复制链接]
查看: 10|回复: 0

架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练

[复制链接]
查看: 10|回复: 0

363

主题

0

回帖

1099

积分

金牌会员

积分
1099
智能配送设备

363

主题

0

回帖

1099

积分

金牌会员

积分
1099
2025-2-9 14:37:59 | 显示全部楼层 |阅读模式
随着大模型技术向多场景渗透,算力需求呈现「大规模、高弹性、低成本」三重挑战。
清微智能基于全球领先的可重构计算架构(CGRA)推出可重构算力芯片RPU(Reconfigurable Processing Unit),实现单机高效运行千亿级参数模型推理和训练,以动态硬件重构、全栈优化及高能效比,重新定义国产AI芯片的性价比标杆。
新年伊始,DeepSeek的惊艳亮相,不仅在科技圈掀起巨浪,其影响还涉及到经济、社会、政策等多个维度,相关企业迅速跟进。
以可重构计算技术路线立足于国产AI芯片赛道的清微智能也积极响应,其RPU芯片已完成DeepSeek-R1系列模型的适配和部署运行。

                                                                  
         
清微智能RPU芯片通过可重构计算架构映射和数据流控制技术,在处理AI任务时,以更高效率实现计算资源的动态调度分配,摒弃传统指令处理流程和共享存储数据交换机制,使硬件资源更聚焦于核心计算任务。
清微智能算力服务器支持无交换机自组网调度,显著提升计算资源利用率与能效比,单机支持从1.5B、7B到六千亿参数的DeepSeek全量模型,是国产算力支持国产DeepSeek大模型的高性价比独特方案。
清微智能算力服务器具有训推一体特点,不仅在DeepSeek系列模型的推理上表现出优异的性能,同时高性能支持基于DeepSeek模型对其他模型进行蒸馏训练,极大方便了用户实现大模型本地私有化部署。
例如:使用DeepSeek-R1模型对NuminaMath-TIR等数据集的问题进行推理解答,生成的思考过程和答案作为Qwen2-7B模型蒸馏训练数据集,基于清微智能算力服务器加载蒸馏训练数据集和Qwen2-7B的模型权重及配置文件,进行Qwen2-7B模型的蒸馏训练。

连日来,DeepSeek系列模型的火爆出圈,凸显了国产大模型创新爆发出震撼全球的威力。
清微智能RPU芯片以计算架构创新,结合国产模型路径创新,迸发出强强联合1+1>2的效果,为AI用户提供了更具经济性的组合选择。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

363

主题

0

回帖

1099

积分

金牌会员

积分
1099

QQ|智能设备 | 粤ICP备2024353841号-1

GMT+8, 2025-3-10 15:07 , Processed in 1.104930 second(s), 30 queries .

Powered by 智能设备

©2025

|网站地图