OeR2m8y 发表于 5 天前

虹软推出新一代视觉大模型ArcMuse 2025 V1.1

大模型从最初的“不计成本”探索,到如今的“可持续”商业化落地,经历了从技术突破到工程优化,再到产业融合的深度演进。在这一过程中,虹软始终走在创新前沿,依托深厚的视觉AI技术积累,以ArcMuse计算技术引擎为核心,不断推动视觉大模型的技术进步与行业落地,加速AI在各领域的深度应用。
        自2023年推出以来,ArcMuse计算技术引擎凭借持续的 算法创新与工程优化 ,构建起多层次架构、跨模型协同优化、高效能计算引擎等核心能力,不断突破通用大模型在计算成本、适配效率、推理速度等方面的局限。如今,经过对算法、数据、工程及大模型生态的全面优化,ArcMuse迎来了全新升级 —— ArcMuse 2025 V1.1版本。新一代ArcMuse在生成质量、计算效率、端侧适配性等方面取得了显著突破 , 进一步 增强了视觉大模型的泛化能力与实用性 。其先进的视觉AI能力全面支持智能手机、智能汽车、AI眼镜、机器人、服装智造以及智能商拍的创新发展。

        ArcMuse 2025 总体架构与核心愿景:视觉AI核心基座引擎,不止大模型
        ArcMuse是一个 兼顾效果和性能的紧凑AI综合体 ,它以大底模和强化的垂直大模型为基础,用以生成远观悦目的基础效果,并利用一系列复杂或简单细分小模型、浅层模型、用于约束的CV&CG引擎包对基础效果进行控制,以达到近看自然、结构信息正确、细节丰富合理的最终图像和视频效果。
        ArcMuse 2025核心思想与架构:
        ArcMuse是一套深度耦合底模、细分大模型、控制浅层复杂模型和视觉库、约束细节的浅层小模型和视觉库,数据预处理引擎包、CV&CG处理引擎包、定制化文本生成模型的紧凑稳定AI平台库。
        CPG(Control Packages) : 利用五大类小模型和引擎包对期望的结果进行约束与控制。
        人 物: 手、脸、脚、四肢、体
        深度: 各类摄像头、模组、模式的输入,都能得到高质量的深度
        分割: 基于对象、区域、语义等
        分类: 景、物、影调、情感等
        边缘: 强、弱、结构、遮挡、悬空等
        KDE(Keep Details Engines) :利用一些浅层模型保留弱纹理和细节,利用光照模型分析、去除、重光照处理和维持影调(Shading)。
        高效计算优化: 采用FP8混合精度计算,对核心计算复杂度高的OPs进行汇编级优化。
        训练和推理时的减冗余并行处理引擎包 :这点得益于公司定位实际应用落地有回报的降本压力,进而研发出高效的基础引擎和策略。
        平台无关化的各种处理 :依托虹软 20 余年的视觉AI技术积累,使 ArcMuse 具备跨平台适配能力,可灵活部署于云端、高性能计算平台、移动端及嵌入式设备。
        从实用落地的角度来看,真正可行的 AI 大模型方案必须实现 多层次协同与功能模块互补 ,降低计算成本,以推动大模型应用平权化,使其更广泛地赋能终端设备与各行业。ArcMuse 2025 正是基于这一理念让视觉 AI 在真实应用场景中 实现性能、效果与成本的三重突破 。
        从 DeepSeek 到 ArcMuse 2025:构建大模型新范式
        AI 计算的高效降本是大模型商业可行化落地的关键,其核心在于 降低计算资源消耗 、 减少存储需求与数据依赖 ,以更低的成本提供可接受甚至卓越的AI性能,使先进AI技术(包括大模型)能够更广泛地惠及各行业与终端设备。要实现这一目标,仅依赖单一大模型或传统Transformer架构的顶级云计算平台远远不够,而必须借助 多AI范式的深度耦合 ,并具备 动态多层次的自适应能力的AI计算架构 ,以应对不同计算环境的需求。
        在这点上, DeepSeek 在文本和规则性较强的AI任务(如数学、代码等) 上的策略,提供了一个典型的成功案例。其通过 DS-MOE(动态路由稀疏专家网络)、MLA(KV矩阵缓存压缩)、MTP(多Token预测)、FP8(混合精度量化训练)、GRPO (强化学习采用群组相对策略优化)、DualPipe(调度算法) 等优化策略,极大提升了大模型的计算效率,并降低了硬件成本,为大模型高效降本提供了新的思路。然而,DeepSeek 在推理计算与存储占用上仍然存在一定的优化空间,特别是对于图像、视频等视觉任务而言,如何借鉴这些优化思想,并结合视觉AI的独特需求,是一个关键课题。
        在这一背景下, 虹软对 DeepSeek 的优化策略进行了深入分析 ,并结合自身在视觉 AI领域的多年研发经验,取长补短、深度融合,同时针对视觉 AI 的特性进行了 定制化优化 。实践证明,这一耦合总体上带来了 显著的增益 ,不仅全面提升了ArcMuse的性能,尤其在 多模态数据理解、图像与视频推理增强方面效果突出 ;同时, 计算成本大幅降低 ,例如,在提示词工程推理方面, 显卡租赁成本减少了一半以上 ,使大模型的 AI计算更高效且可控 。
        为直观展现 ArcMuse 2025 在视觉生成、影像修复及视频生成方面的能力,我们以非刚体拓扑难以保持的柔性衣物为背景,呈现其在复杂视觉任务中的卓越表现。
        生成图像示例1:
        弱纹理、细节提升
        生成图像示例2:
        细节、影调的提升
        困难场景(Hard Case)示例:半透物(薄纱)、柔性物(裙装)、复杂版型(塞腰、束腕)、弱纹理细节(纹理花纹、花边领、暗条纹)
        生成图像示例4 :
        AI模特图大角度、模特表现力更新
        生成图像示例5 :
        AI生成图的光影效果、模特表现力更新
        生成视频示例6:
        AI模特复杂动作的稳定性、表现力更新
        生成图像示例7:半透装、碎花裙
        生成视频示例8:
        让示例7生成图像再动起来
        ArcMuse 2025 为垂直行业提供定制化解决方案
        ArcMuse 2025 的架构是一种系统性优化方案,通过整合多个 AI 引擎,实现高效协同,即使在有限资源下仍能发挥最大效能,并为各类垂直行业提供定制化解决方案。这一架构理念使 ArcMuse 成为 虹软视觉 AI 赋能引擎 ,可广泛应用于移动智能终端 AI 影像处理、智能汽车、AI 眼镜、XR 3D 空间计算头显、服装智造和智能商拍以及智能机器人等垂直场景,推动行业创新升级。
        在AI影像处理方面,ArcMuse 2025对AI影像模型进行了优化,特别是在图像增强与影像细节恢复过程中,显著减少了生成不真实效果的风险。升级后的模型在处理复杂纹理和高对比度场景时,展现出较为稳定的增强效果,降低了图像生成中的不确定性。另外,在语义分割与识别方面,ArcMuse 2025进一步增强了ArcMuse 2024对图像内容的理解精度,尤其是在文字纹理处理上,表现出比以往更强的模型细节还原能力。
        在智能汽车方向,ArcMuse 2025的推理能力和场景理解能力得到提升,尤其在低能见度和复杂路况环境下,其优化后的推理方法能够结合不同的驾驶环境进行分析,为驾驶员提供更为合理的安全辅助建议。例如,在大雾天气和湿滑路况下,系统能够根据前方车辆的灯光信号、车速以及路面状态,提出合理的驾驶策略与建议,减少潜在的驾驶或行车风险。
        在 AI 眼镜与 XR 3D 空间计算头显方向,ArcMuse 2025明显提升了对复杂环境下物体识别的精度,尤其是在图像语义分割和物体关系的理解上。在应用中,ArcMuse 2025能够更加精确地区分复杂环境中的物体和背景,减少误识别的情况。例如,在对图像中的窗户与画作进行区分时,ArcMuse 2025 通过优化图像分析流程,有效避免了误识别,提高了识别的准确度。
        在智能商拍方向,ArcMuse 2025利用内部新迭代的蒸馏框架优化了文本与图像生成的控制精度,使得在提示词响应的准确性和图像生成的可靠性方面有更高的提升。升级后的ArcMuse有更强的文本与图像的匹配能力,能够更好地生成符合商业需求的图像。
        在智能机器人方向,ArcMuse 2025通过优化多模态数据处理、实时目标识别、复杂场景理解等可显著提升机器人在动态环境中的适应性和自主性。同时,针对端侧部署深度优化,可使其在有限算力下依然高效运行 AI 任务,助力其在工业自动化、智能服务、家庭陪护、教育娱乐等应用落地。
        视觉大模型实用化:多AI协同,驱动创新落地
        虹软的视觉AI技术研发经历了20多年的历练,绝大多数技术都实现了产品化应用和实际落地,达到了100亿级端侧设备的实际应用。虹软的AI研发经历了从CV&CG到浅层学习,从端侧深度学习到复杂模型,从底座模型强化到领域大模型;效果和性能、功耗3指标并举的多阶段扎实迭代向前演进。
        在当下的AI技术快速发展浪潮中,大模型成为行业关注的焦点,近来DeepSeek又带来一波强化剂。虹软认为真正高效的智能计算体系不是单一的通识大模型,每个AI引擎有各自的效果和性能优缺点,须深度耦合、效果性能权衡,这样才能帮助视觉大模型真正快速落地实用化。
        另外,一个非常有意义的目标是:“大模型普及与可商业化”。其核心是算力要求要尽可能低,存储资源要尽可能少,数据要求要尽可能少,成本尽可能省,但效果尽可能好。这样的话,多AI范式的高度耦合,且是动态多层次的AI计算架构,才是逻辑合理的选择,仅靠目前单一的视觉大模型还不够、走不通,这就是ArcMuse的架构思路和定位。
                                       
                                          声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。                        举报投诉                  
                  
                           
[*]                              视觉                                                                                                                                                                                                      视觉                                          
                                          +关注
                                       
                                       
                                                                                                                                    关注
                                                1                                          
                                                                                          文章
                                                149                                          
                                                                                          浏览量
                                                24087                                          
                                       
                                    
                              
[*]                              虹软                                                                                                                                                                                                      虹软                                          
                                          +关注
                                       
                                       
                                                                                                                                    关注
                                                1                                          
                                                                                          文章
                                                55                                          
                                                                                          浏览量
                                                4543                                          
                                       
                                    
                              
[*]                              大模型                                                                                                                                                                                                      大模型                                          
                                          +关注
                                       
                                       
                                                                                                                                    关注
                                                2                                          
                                                                                          文章
                                                2760                                          
                                                                                          浏览量
                                                3405                                          
                                       
                                    
                              
                        
                                       

                                                原文标题:虹软新一代视觉大模型ArcMuse 2025 V1.1正式发布,全面赋能手机、汽车、眼镜、机器人、服装智造和智能商拍行业
                            文章出处:【微信号:ArcSoft_World_Wide,微信公众号:虹软】欢迎添加关注!文章转载请注明出处。
                        
               
                                                            收藏                        0人收藏                                                                                                                                                                                                扫一扫,分享给好友
                                       
                                        复制链接分享
                                    
                              
                           
                        
                  
                                                      
                                                    评论

                林超文PCB设计:PADS教程,PADS视频教程郑振宇老师:Altium Designer教程,Altium Designer视频教程张飞实战电子视频教程朱有鹏老师:海思HI3518e教程,HI3518e视频教程李增老师:信号完整性教程,高速电路仿真教程华为鸿蒙系统教程,HarmonyOS视频教程赛盛:EMC设计教程,EMC视频教程杜洋老师:STM32教程,STM32视频教程唐佐林:c语言基础教程,c语言基础视频教程张飞:BUCK电源教程,BUCK电源视频教程正点原子:FPGA教程,FPGA视频教程韦东山老师:嵌入式教程,嵌入式视频教程张先凤老师:C语言基础视频教程许孝刚老师:Modbus通讯视频教程王振涛老师:NB-IoT开发视频教程Mill老师:FPGA教程,Zynq视频教程C语言视频教程RK3566芯片资料合集朱有鹏老师:U-Boot源码分析视频教程开源硬件专题

                                                                                    发布评论请先 登录
               
                                                    相关推荐
                                                
          虹软AI视觉赋能雷鸟V3 AI拍摄眼镜发布   

    近日,雷鸟创新正式发布全新一代AI拍摄眼镜——雷鸟V3。该产品搭载多项创新技术,包括融合虹软AI视觉算法的猎鹰影像系统、通义独家定制大
            https://www.elecfans.com/d/6474186.html#render_38b46e74788e4f0c3adfd10f8786c6c1      发表于 01-08 10:58                •513次阅读            
   
                                    Garmin佳明和天马推出新一代数字座舱解决方案   

    在即将开幕的国际消费电子展(CES 2025)上,Garmin佳明推出全新一代数字座舱解决方案Garmin Unified Cabin 2025。该方案配备了天马多款车规级显示屏,其中
            https://www.elecfans.com/d/6474186.html#render_38b46e74788e4f0c3adfd10f8786c6c1      发表于 01-07 16:16                •375次阅读            
   
                                    Garmin佳明和高通推出新一代数字座舱解决方案   

    Garmin佳明和高通技术公司在2025年国际消费电子展(CES 2025)上宣布,双方将扩展在汽车技术领域的合作,推出全新一代数字座舱解决方案Garmin Unified Cabin
            https://www.elecfans.com/d/6474186.html#render_38b46e74788e4f0c3adfd10f8786c6c1      发表于 01-07 10:38                •338次阅读            
   
                                    虹软ArcMuse计算技术引擎全面升级   

    经过半年多的潜心研发和技术攻关,虹软ArcMuse计算技术引擎迎来全面升级,实现多项关键技术突破。升级内容涵盖高清视频生成、AI模特图高精度生成、智能试衣和平铺图生成等领域,有效攻克了商拍领域中的诸多核心难点。
            https://www.elecfans.com/d/6474186.html#render_38b46e74788e4f0c3adfd10f8786c6c1      发表于 12-11 17:34                •449次阅读            
   
                                    亚马逊云科技推出新一代Amazon SageMaker   

    为数据、分析和AI提供统一平台 北京2024年12月10日 /美通社/ -- 亚马逊云科技在2024 re:Invent全球大会上,宣布推出新一代Amazon SageMaker,将客户所需的快速
            https://www.elecfans.com/d/6474186.html#render_38b46e74788e4f0c3adfd10f8786c6c1      发表于 12-10 15:53                •204次阅读            
   

                                    比亚迪2025年将推出新一代刀片电池   

    比亚迪公司近日宣布,公司计划在2025年推出最新一代刀片电池。这一举措旨在显著提升电动汽车的续航能力和电池寿命,进一步推动电动汽车技术的发展
            https://www.elecfans.com/d/6474186.html#render_38b46e74788e4f0c3adfd10f8786c6c1      发表于 11-26 10:49                •1089次阅读            
   
                                    DeepL推出新一代翻译编辑大型语言模型   

    在人工智能与语言处理领域,DeepL再次以其创新实力引领潮流,宣布成功推出新一代面向翻译与编辑应用的大型语言模型。这一里程碑式的进展,不仅巩固了DeepL作为顶尖语言人工智能公司的地位,更标志着机器翻译技术向更高质量、更智能化方
            https://www.elecfans.com/d/6474186.html#render_38b46e74788e4f0c3adfd10f8786c6c1      发表于 07-19 15:56                •792次阅读            
   
                                    Nullmax正式推出新一代自动驾驶技术Nullmax Intelligence   

    7月16日,Nullmax在上海举办“AI无止境,智变新开端”2024技术发布会,正式推出新一代自动驾驶技术Nullmax Intelligence(简称“NI”)。新技术着重于打造全场景的自动驾驶应用,以纯视觉、真无图、多模态的技术特点,助力汽车智能进化。
            https://www.elecfans.com/d/6474186.html#render_38b46e74788e4f0c3adfd10f8786c6c1      发表于 07-17 09:32                •724次阅读            
   
                                    DK065G高性能AC-DC氮化镓电源管理芯片规格书V1.1   

    DK065G钲铭科氮化镓电源芯片规格书V1.1
                  发表于 07-10 11:25                        •6次下载   
   

                                    英飞凌科技推出新一代碳化硅(SiC)MOSFET沟槽栅技术   

    英飞凌科技推出新一代碳化硅(SiC)MOSFET沟槽栅技术,开启功率系统和能量转换的新篇章。与上一代产品相比,英飞凌全新的 CoolSiC™ MOSFET 650 V 和 1200 V
            https://www.elecfans.com/d/6474186.html#render_38b46e74788e4f0c3adfd10f8786c6c1      发表于 04-20 10:41                •1203次阅读            
   
                                    Holtek推出新一代直流无刷电机专用SoC Flash MCU BD66FM8452F   

    Holtek推出新一代直流无刷电机专用SoC Flash MCU BD66FM8452F,整合MCU、LDO、三相32V 驱动器、VDC Bus电压侦测与高压FG电路,All-in-one方案
            https://www.elecfans.com/d/6474186.html#render_38b46e74788e4f0c3adfd10f8786c6c1      发表于 04-16 18:03                •1264次阅读            
   
                                    长电科技近日推出新一代“5G+”通信芯片封装方案   

    长电科技近日推出新一代“5G+”通信芯片封装方案,致力于提升通信技术在恶劣环境下的可靠性和性能。
            https://www.elecfans.com/d/6474186.html#render_38b46e74788e4f0c3adfd10f8786c6c1      发表于 04-15 10:25                •723次阅读            
   
                                    SBS V1.1兼容气体表IC bq2060SBS数据表   

    电子发烧友网站提供《SBS V1.1兼容气体表IC bq2060SBS数据表.pdf》资料免费下载
                  发表于 04-08 10:36                        •0次下载   
   

                                    TE Connectivity推出新一代RAST 5.0高保持力连接器   

    TE Connectivity(以下简称“TE”)推出新一代 RAST 5.0 高保持力连接器,创新的组装方式让保持力加强,提供更稳定可靠的连接。
            https://www.elecfans.com/d/6474186.html#render_38b46e74788e4f0c3adfd10f8786c6c1      发表于 03-28 16:39                •953次阅读            
   
                                    英飞凌推出新一代碳化硅技术CoolSi MOSFET G2   

    在电力电子领域持续创新的英飞凌科技股份公司近日宣布,其已成功推出新一代碳化硅(SiC)MOSFET沟槽栅技术——CoolSiC™ MOSFET Generation 2。这一创新技术的推出,标志着功率系统和能量转换领域迎来了新的
            https://www.elecfans.com/d/6474186.html#render_38b46e74788e4f0c3adfd10f8786c6c1      发表于 03-12 09:43                •835次阅读
页: [1]
查看完整版本: 虹软推出新一代视觉大模型ArcMuse 2025 V1.1