English 简体中文 繁體中文 한국 사람 日本語 Deutsch русский بالعربية TÜRKÇE português คนไทย french
查看: 12|回复: 0

百川智能发布深度思考模型 Baichuan-M1-preview,同时具备语言、视觉和搜索三大领域推理能力

[复制链接]
查看: 12|回复: 0

百川智能发布深度思考模型 Baichuan-M1-preview,同时具备语言、视觉和搜索三大领域推理能力

[复制链接]
查看: 12|回复: 0

387

主题

0

回帖

1171

积分

金牌会员

积分
1171
zxc

387

主题

0

回帖

1171

积分

金牌会员

积分
1171
2025-1-24 17:01:53 | 显示全部楼层 |阅读模式
IT之家 1 月 24 日消息,百川智能今日宣布推出全场景深度思考模型 Baichuan-M1-preview,聚齐三大核心推理能力。同时,百川智能还推出了行业首个开源医疗增强大模型 Baichuan-M1-14B。

据官方介绍,Baichuan-M1-preview 同时具备语言、视觉和搜索三大领域推理能力,在数学、代码等多个权威评测中的表现可对标 o1-preview。
IT之家注意到,它还解锁了“医疗循证模式”,实现了从证据检索到深度推理的完整端到端服务,能够快速、精准地回答医疗临床、科研问题。

Baichuan-M1-14B 则是 Baichuan-M1-preview 的小尺寸版本,同时也是行业首个开源的医疗增强大模型。据介绍,其医疗能力超越了更大参数量的 Qwen2.5-72B,与 o1-mini 相差无几。

  • Github:https:https//github.com/baichuan-inc/Baichuan-M1-14B
  • Huggingface(base):https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Base
  • Huggingface(Instruct):https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Instruct
  • NPU 版本支持 BF16 推理:https://modelers.cn/models/MindIE/Baichuan-M1-14B-Base

语言推理方面,其在 AIME 和 Math 等数学基准测试,以及 LiveCodeBench 代码任务上的成绩均超越了 o1-preview 等模型。
视觉推理能力方面,在 MMMU-val、MathVista 等权威评测中的成绩,超越了 GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview 等模型。

此文章来自:IT之家如有涉及侵权请通过邮箱联系:fnhjeqj@163.com删除。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

387

主题

0

回帖

1171

积分

金牌会员

积分
1171

QQ|智能设备 | 粤ICP备2024353841号-1

GMT+8, 2025-3-10 15:39 , Processed in 0.726195 second(s), 30 queries .

Powered by 智能设备

©2025

|网站地图