壁仞科技顺利部署DeepSeek R1千问蒸馏模型
以下文章来源于Gitee AI,作者马建仓DeepSeek 的国内算力支持队伍进一步壮大:来自上海的壁仞科技顺利部署DeepSeek-R1-Distill千问蒸馏模型(1.5B/7B/14B/32B),并已上线 Gitee AI 免费使用。
蒸馏小模型超越 OpenAI o1-mini
通过 DeepSeek-R1 的输出,DeepSeek 团队蒸馏并开源了 6 个小模型,其中 32B 和 70B 参数的模型在多项能力上实现了对标 OpenAI o1-mini 的效果。
本次壁仞科技共部署了1.5B/7B/14B/32B四个不同参数的千问蒸馏模型,其中 32B 参数模型在输出质量和资源占用中取得了较好的平衡,更推荐开发者们使用。
32B参数模型使用壁仞算力的推理速度
壁仞科技联合科华数据,加速国产算力再升级
壁仞科技成立于 2019 年,致力于开发原创性的通用计算体系,建立高效的软硬件平台,同时在智能计算领域提供一体化的解决方案。从发展路径上,壁仞科技将首先聚焦云端通用智能计算,逐步在人工智能训练和推理等多个领域赶超现有解决方案,实现国产高端通用智能计算芯片的突破。
基于壁砺TM系列训推产品 106M、106B、106E、110E,凭借先进的芯片架构、高效的多模型适配能力、广泛的数据精度支持以及强大的解码能力,配合算力集群供应商科华数据的强力支撑,仅用数小时即完成对 DeepSeek R1 全系列蒸馏模型的支持。
科华数据全国智算中心具备极致可靠、超高密度、弹性预制、绿色低碳、多样算力等特性。在智算中心的发展中融合「算网」、「算液」、「算效」,让算力从「用得了」、「用得起」到「用的好」。始终坚守以客户需求为导向,融合多行业场景解决方案和科华数据丰富的产品矩阵及技术底蕴来帮助客户实现价值。
100%国内AI新添强援
壁仞科技的加入,为 DeepSeek R1 千问蒸馏模型带来了又一个国内算力强援,也为开发者提供了新的国内算力选择。
同样,Gitee AI 壁仞科技算力资源包中的DeepSeek-R1-Distill-Qwen系列模型依然面向全体开发者免费使用!
点击文末阅读原文,免费使用壁仞算力感受DeepSeek-R1-Distill-Qwen系列模型的出色表现吧!
更多国产算力与 DeepSeek 和 Gitee AI 的对接工作也正在紧锣密鼓进行中,努力为开发者提供更高效、更灵活的 AI 应用解决方案。
除了国产 GPU 芯片外,Gitee AI 也正在联合国产生态厂商探索更多形态、更多平台的 AI 模型适配,并将于近期正式上线,各位开发者敬请期待。
Gitee AI 的 Serverless API 提供了文本生成、视觉模型、图像处理、语音识别、语音生成、向量与重排模型、代码生成等 9 种类型共 54 个大模型的 API 使用。通过购买模型资源包,即可通过极低的价格即可尽享众多主流模型。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
[*] 算力 算力
+关注
关注
1
文章
1020
浏览量
14965
[*] 壁仞科技 壁仞科技
+关注
关注
1
文章
57
浏览量
2790
[*] DeepSeek DeepSeek
+关注
关注
1
文章
110
浏览量
44
原文标题:100%国产AI新成员:壁仞科技成功适配DeepSeek R1千问蒸馏模型
文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。
收藏 0人收藏 扫一扫,分享给好友
复制链接分享
评论
林超文PCB设计:PADS教程,PADS视频教程郑振宇老师:Altium Designer教程,Altium Designer视频教程张飞实战电子视频教程朱有鹏老师:海思HI3518e教程,HI3518e视频教程李增老师:信号完整性教程,高速电路仿真教程华为鸿蒙系统教程,HarmonyOS视频教程赛盛:EMC设计教程,EMC视频教程杜洋老师:STM32教程,STM32视频教程唐佐林:c语言基础教程,c语言基础视频教程张飞:BUCK电源教程,BUCK电源视频教程正点原子:FPGA教程,FPGA视频教程韦东山老师:嵌入式教程,嵌入式视频教程张先凤老师:C语言基础视频教程许孝刚老师:Modbus通讯视频教程王振涛老师:NB-IoT开发视频教程Mill老师:FPGA教程,Zynq视频教程C语言视频教程RK3566芯片资料合集朱有鹏老师:U-Boot源码分析视频教程开源硬件专题
发布评论请先 登录
相关推荐
部署DeepSeek R1于AX650N与AX630C平台
背景 春节前,国产大模型 DeepSeek 横空出世,迅速成为AI领域的焦点。作为端侧AI能效比优异的 AX650N、AX630C 芯片平台早已在节前完成 DeepSeek R1
https://www.elecfans.com/d/6450667.html#render_38b46e74788e4f0c3adfd10f8786c6c1 发表于 02-09 09:32 •78次阅读
中软国际科创中心上线DeepSeek模型
DeepSeek的昇腾迁移、模型部署、模型蒸馏、模型精调、SAAS应用、Agent开发等多样化A
https://www.elecfans.com/d/6450667.html#render_38b46e74788e4f0c3adfd10f8786c6c1 发表于 02-08 18:02 •410次阅读
扣子平台支持DeepSeek R1与V3模型
近日,新一代AI应用搭建平台“扣子”宣布了一项重要更新,即正式支持DeepSeek的R1和V3模型,并向广大用户开放免费体验。 扣子平台一直以来都致力于为用户提供便捷、高效的AI应用搭建服务,帮助
https://www.elecfans.com/d/6450667.html#render_38b46e74788e4f0c3adfd10f8786c6c1 发表于 02-08 13:42 •242次阅读
Krea发布Deepseek R1驱动的Chat功能
近日,Krea平台迎来了一项重大更新——全新发布的Krea chat功能。这一功能由Deepseek R1驱动,为用户带来了前所未有的便捷体验。 通过Krea chat,用户可以直接在聊天窗口中调用
https://www.elecfans.com/d/6450667.html#render_38b46e74788e4f0c3adfd10f8786c6c1 发表于 02-08 11:09 •197次阅读
DeepSeek-R1本地部署指南,开启你的AI探索之旅
R1 2025.01.20 DeepSeek-R1 发布,DeepSeek R1 是 DeepSeek AI 开发的第一代推理
https://www.elecfans.com/d/6450667.html#render_38b46e74788e4f0c3adfd10f8786c6c1 发表于 02-08 10:30 •490次阅读
deepin UOS AI接入DeepSeek-R1模型
DeepSeek-R1 模型自发布以来吸引了众多用户关注,为了让 deepin 用户更好地体验这一前沿技术,UOS AI 现已适配接入 DeepSeek-R1 端侧模型!无需忍受服务器
https://www.elecfans.com/d/6450667.html#render_38b46e74788e4f0c3adfd10f8786c6c1 发表于 02-08 09:52 •121次阅读
吉利星睿大模型与DeepSeek完成深度融合
DeepSeek R1 的顶尖认知能力,对星睿车控 FunctionCall 大模型、汽车主动交互端侧大模型等进行蒸馏训
https://www.elecfans.com/d/6450667.html#render_38b46e74788e4f0c3adfd10f8786c6c1 发表于 02-07 18:13 •365次阅读
鲲云科技AI芯片CAISA 430成功适配DeepSeek R1模型
鲲云科技全新一代的可重构数据流 AI 芯片 CAISA 430 成功适配 DeepSeek R1 蒸馏模型推理,这一创新举措为大模型应用的高
https://www.elecfans.com/d/6450667.html#render_38b46e74788e4f0c3adfd10f8786c6c1 发表于 02-07 09:57 •312次阅读
腾讯云TI平台推出DeepSeek系列模型
近日,腾讯云TI平台宣布重要更新,正式上架DeepSeek系列模型。此次上架的模型包括参数量高达671B的“满血”V3和R1原版模型,以及基
https://www.elecfans.com/d/6450667.html#render_38b46e74788e4f0c3adfd10f8786c6c1 发表于 02-06 14:30 •160次阅读
摩尔线程宣布成功部署DeepSeek蒸馏模型推理服务
。 据悉,DeepSeek开源模型在多语言理解与复杂推理任务中一直表现出卓越的性能,其V3、R1等系列模型更是备受业界关注。而此次摩尔线程所实现的D
https://www.elecfans.com/d/6450667.html#render_38b46e74788e4f0c3adfd10f8786c6c1 发表于 02-06 13:49 •200次阅读
云天励飞上线DeepSeek R1系列模型
-Distill-Llama-70B大模型、DeepSeek V3/R1 671B MoE大模型也在有序适配中。适配完成后,DeepEdge10芯片平台将在端、边、云全面支持
https://www.elecfans.com/d/6450667.html#render_38b46e74788e4f0c3adfd10f8786c6c1 发表于 02-06 10:39 •174次阅读
DeepSeek R1在壁仞科技AI算力平台发布
DeepSeek开源模型的推出,不仅为AI技术的普及和应用提供了强有力的支持,也开启了行业创新与变革的新篇章。凭借其开放性、高效性和易用性,DeepSeek开源模型正在成为推动AI技术
https://www.elecfans.com/d/6450667.html#render_38b46e74788e4f0c3adfd10f8786c6c1 发表于 02-06 09:10 •276次阅读
英伟达发布DeepSeek R1于NIM平台
英伟达近日宣布,其DeepSeek R1 671b版本已正式上线英伟达NIM(NVIDIA Inference Microservices)平台,并以预览版的形式在build.nvidia.com
https://www.elecfans.com/d/6450667.html#render_38b46e74788e4f0c3adfd10f8786c6c1 发表于 02-05 14:48 •175次阅读
对标OpenAI o1,DeepSeek-R1发布
今天,我们正式发布 DeepSeek-R1,并同步开源模型权重。 DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借助 R
https://www.elecfans.com/d/6450667.html#render_38b46e74788e4f0c3adfd10f8786c6c1 发表于 01-22 13:46 •493次阅读
性能提升近一倍!壁仞科技携手无问芯穹,在千卡训练集群等领域取得技术新突破
随着智能算力需求的倍增,到2024年,千卡算力集群已成为国内大模型训练的必备场景。壁仞科技,作为国内少数拥有原创训推一体架构的高端算力芯片厂商之一,与在AI算力市场具有重要影响力的无
发表于 11-05 18:45 •975次阅读
页:
[1]