Ai 系列 —— DeepSeek 初步介绍
DeepSeek 初步使用介绍背景
Ai 正在慢慢在改变我们的生活,比如老一辈可能已经在用豆包(字节跳动推出的AI聊天机器人)
前端开发,某些公司内部已在使用图生文(设计稿生成前端代码)
网上也有许多通过 DeepSeek 生成的许多诱人的文章:普通人如何一年赚100w、看起来不起眼但利润很高的行业、普通人一辈子也可能不知道的信息差、35岁失业人员的出路在哪里...
本系列期望能通过这类 ai 工具的使用,看是否能改善工作和生活
DeepSeek 简介
DeepSeek(深度求索) 是一家专注实现AGI(通用人工智能)的中国科技公司
这里主要指该公司的Ai产品:DeepSeek。官网如下:
界面如下:
Tip: DeepSeek获四大国产GPU力挺、DeepSeek从入门到精通_余梦珑博士后.pdf
DeepSeek 使用
deepseek 官网可用性不太好,比如搜索问题,会超时服务器繁忙,请稍后再试。以下介绍两个可免费、方便使用的 DeepSeek 的渠道:腾讯元宝、纳米AI。
腾讯元宝网页版
浏览器打开腾讯元宝网页版,则可直接使用 deepseek 满血版(即非阉割版)。
选择模型 DeepSeek,以及深度思考(R1)、联网搜索(下文在“DeepSeek 的三种模式”会详细介绍)
然后就可以和DeepSeek对话了。
纳米Ai网页版
浏览器打开纳米Ai网页版,无需注册即可直接使用。界面如下
DeepSeek-R1-联网满血版 671B表示:DeepSeek-R1推理模型(DeepSeek还有一个V3模式),671B代表模型的参数规模为6710亿,是目前DeepSeek系列中最大的参数规模。
DeepSeek 背景知识
DeepSeek 的三种模型
DeepSeek有三种模式:DeepSeek-V3、DeepSeek-R1-Zero、DeepSeek-R1(DS-R1)
DeepSeek-V3
[*]定位:通用型语言模型,对标OpenAI GPT-4o,采用混合专家(MoE)架构,专注于自然语言处理任务(如文案生成、多轮对话)和基础推理
[*]特点:训练成本低(仅557万美元),支持FP8混合精度训练,推理速度达60字符/秒,适合高响应需求场景
DeepSeek-R1-Zero
[*]定位:R1模型的中间产物,基于V3基座模型通过纯强化学习(RL)训练而成,未引入人工监督微调(SFT)
[*]特点:专注于生成冷启动思维链数据(CoT),解决推理任务的可读性差和逻辑混合问题,但输出格式较原始
DeepSeek-R1(DS-R1)
[*]定位:强化推理模型,对标OpenAI o1,通过多阶段训练整合冷启动数据与强化学习,擅长数学证明、代码生成等复杂任务
[*]特点:支持深度思考模式,生成答案前展示推理过程,但响应速度较慢(需2-3分钟)
三种模型的关系
从V3到R1-Zero
[*]纯强化学习阶段:以V3为基座,通过规则驱动的奖励机制(如准确性奖励、格式奖励)进行训练,生成R1-Zero
[*]关键创新:采用GRPO算法替代传统PPO,无需额外价值模型,降低训练资源消耗
Tip:群相对策略优化(GRPO)是近端策略优化(PPO)的一种变体,它可以增强数学推理能力,同时优化 PPO 的内存使用情况(参考这里)
从R1-Zero到DS-R1
[*]多阶段训练管道:
[*]阶段一:利用R1-Zero生成的冷启动数据对V3进行微调,提升推理可读性
[*]阶段二:引入通用指令数据(如写作、角色扮演任务)进行监督微调,增强泛化能力
[*]阶段三:结合规则奖励与偏好奖励优化,最终形成DS-R1
[*]知识蒸馏:DS-R1通过蒸馏技术生成轻量版(如Qwen/Llama系列),降低部署成本
维度DeepSeek-V3DeepSeek-R1-ZeroDeepSeek-R1推理能力基础逻辑分析冷启动数据生成复杂逻辑推理(数学/代码)训练成本557万美元(2048块GPU)依赖V3基座模型高(需多阶段强化学习)响应速度0.5秒/次未开放使用2-3分钟/次(深度思考模式)适用场景文案生成、客服、多模态任务中间产物,不直接应用科研、金融量化、代码调试开源支持支持FP8权重本地部署未开源MIT许可证,支持模型蒸馏DeepSeek 的三种模式
DeepSeek提供给用户提供了三种模式:V3、R1和联网搜索。
基础模型(V3)是DeepSeek的标配模式,也是大多数用户在使用时默认选择的模式。自2024年12月升级后,V3的性能得到了显著提升,其性能可以媲美业内顶尖模型如GPT-4和Claude-3.5。V3模型适用于处理日常的百科类问题,帮助用户快速获取信息。无论是查询常见知识还是处理简单的文本生成任务,V3都能够迅速给出答案。它的优点在于高效和便捷,几乎没有使用门槛,适用于大部分场景。特别适合在用户不需要复杂推理和深度分析的情况下使用
深度思考(R1)是DeepSeek的深度推理模型,专门用于解决需要复杂推理和深度思考的问题。这种模式处理的任务更具挑战性,例如数理逻辑推理、编程代码分析等。R1模型拥有660B的参数,并采用了后训练+RL强化学习方法,擅长从多个角度分析问题,并给出经过严密推理后的解答。R1模型在处理推理、深度思考以及复杂逻辑问题时展现了非凡的能力,因此非常适合需要高精度推理的场景,如科学研究、复杂问题求解和逻辑分析
Tip: deepseek R1开源的推理模型,性能对齐 openAi-o1 正式版
联网搜索是DeepSeek的AI搜索功能,基于RAG(检索增强生成)技术。这种模式使DeepSeek不仅能够依赖自己的知识库,还能根据互联网实时搜索相关内容来回答问题。这意味着联网搜索不仅能够让模型回答2024年7月以后的问题,还可以利用网络上的最新信息来补充自己的回答。这对于获取最新的信息和动态非常有用,尤其是在需要了解2024年7月以后发生的事件或新兴技术领域的问题
DeepSeek 蒸馏技术
DeepSeek 的蒸馏(Distillation)是一种将大型复杂模型(教师模型)的推理能力迁移到小型高效模型(学生模型)的技术,旨在降低模型部署成本的同时保留核心性能。
通过教师模型(如 DeepSeek-R1 671B)生成高质量推理数据(如数学证明步骤、逻辑分析过程),学生模型(如 Qwen-7B)模仿这些数据完成监督微调(SFT),从而继承复杂推理能力
通俗点说
想象学校里有个超级学霸(教师模型),他能解最难的数学题,但每次考试都要带一卡车草稿纸(算力成本高)。这时候,老师想培养一个“小学霸”(学生模型),让他用更少的草稿纸(算力)也能解出大部分难题。
关键操作:
[*]学霸示范:让大学霸先做题,把解题步骤详细写出来(生成推理数据)
[*]学渣模仿:小学霸直接学这些步骤,不用自己从头研究(监督微调)
[*]浓缩精华:老师把大学霸的“解题套路”总结成口诀(结构化知识),让小学霸背下来
以泡茶做类比:
[*]大学霸像一壶浓茶,用10克茶叶泡出醇厚味道(复杂模型),但成本太高。
[*]小学霸像一壶淡茶,用2克茶叶,但通过反复冲泡浓茶(蒸馏),也能保留80%的茶香
蒸馏版优点:
[*]省钱:小学霸的“草稿纸”用量减少30%-70%,电费和维护成本大幅降低
[*]速度快:小学霸做题不用反复验算,直接套模板,响应速度提升(比如手机也能运行)
[*]灵活部署:小学霸能塞进智能手表、摄像头,甚至老款手机里
蒸馏版和满血版
如果你需要高精度和全面能力,选择满血版;如果追求效率和轻量化,选择蒸馏版。
如何区分蒸馏版和满血版?
可以问deepseek:一个汉字具有左右结构,左边是木,右边是乞。这个字是什么?
如果回答是杚,拼音为 gài 或 gǔ,说明很可能是满血版
推理模型和通用模型
推理模型:专注于解决特定领域的复杂问题,适合对逻辑推理要求高的场景,但训练成本高、响应速度较慢。
通用模型:适用于广泛任务,灵活性强,训练成本较低,响应速度快,但在特定领域的深度推理能力可能不足。
维度推理模型通用模型主要目标解决特定领域的复杂逻辑问题处理广泛任务,适应多种场景适用场景科研、金融量化、代码调试文案生成、客服、多模态任务训练成本高(需多阶段强化学习)较低(基于通用数据训练)响应速度较慢(深度思考模式)较快(实时响应)灵活性专注性强,适用领域有限灵活性强,适用领域广泛示例DeepSeek-R1DeepSeek-V3推理模型
[*]OpenAI o系列:o1、o3-mini
[*]DeepSeek-R1(开源推理模型)
通用模型:
[*]GPT-3/4系列:GPT-3.5、GPT-4、GPT-4o
[*]Google BERT
[*]传统LLM:如Claude-3.5-Sonnet
671B
在DeepSeek模型中,671B代表模型的参数规模为6710亿(67.1 billion),属于超大规模语言模型的范畴。这一参数规模体现了模型的计算能力和复杂程度。
模型规模典型用途硬件需求性能差距1.5B-7B移动端/轻量级任务低配GPU(如RTX3060)仅能处理简单任务,易出错32B-70B企业级服务(如客服、文案生成)中端GPU集群中等复杂度任务表现尚可671B科研/复杂问题解决千卡GPU集群输出质量接近人类专家说明:
[*]模型规模:从轻量级(1.5B-7B)到超大规模(671B),规模越大,能力越强。
[*]典型用途:不同规模的模型适用于不同场景,从移动端轻量任务到科研级复杂问题。
[*]硬件需求:模型规模越大,对硬件的要求越高,从低配 GPU 到千卡 GPU 集群。
[*]性能差距:规模越大的模型在处理复杂任务时表现越好,输出质量接近人类专家。
DeepSeek 其他渠道
笔者还尝试了如下几个网页版的 deepseek:
[*]百度千帆,2月18之后开始收费
[*]火山方舟,字节的产品
[*]硅基流动,邀请码是 A6sv2K4C,注册后双方可以得 2000万 tokens,也就是14元
硅基流动
硅基流动邀请码是 A6sv2K4C,注册后双方可以得 2000万 tokens,也就是14元。
用法如下:
注:下图左1的💰表面只能用自己充的钱使用。下图右1的💰🎁表明可以用自己充的钱以及送的钱。如果🎁的模型回答服务器繁忙,请稍后再试,可以使用只能充钱的模型。自己可以充1元试试。笔者当初以为最少只能充14元。
提示语 prompt
提示语是和ai交互的语言。
Tip:关于Deepseek,R1太聪明,没那么听话,所以不要给其太多条条框框。
DeepSeek官网提示库
入口在官网不起眼的地方:
4C法则
4C:Clear(清晰) + Context(上下文)+ Constraint(约束) + Consise(简洁)
清晰:指令明确,避免模糊。
[*]×无上下文示例:写一篇文章(对方也不知道写一篇什么主题的文章,篇幅多长,给谁看)
[*]✅有上下文示例:写一篇关于父爱的短文,适合10岁孩子阅读,字数不超过500字
上下文
[*]×无上下文示例:解释量子力学
[*]✅有上下文示例:请用通俗的语言给初中生解释量子力学是什么
约束
[*]×无约束示例:解释“为学日益 为道日损”
[*]✅有约束示例:请用3句话解释“为学日益 为道日损”,语气正式
简介
[*]×无简介示例:我希望你能在接下来的回答中,尽可能详细的描述西红柿炒蛋的详细步骤,包括但不限于准备材料、步骤和注意事项,尽量不要遗漏任何细节
[*]✅有简介示例:描述西红柿炒蛋的详细步骤,包含准备材料和注意事项
PAU法
你是一名哈佛大学的物理教授,用通俗易懂的语言解释量子力学
示例法
比如你想让ai将一些语句改成正式语气,但是正式语气有许多种,ai也不知道你要的语气是什么,可以给示例:
示例1:原句:这个产品挺好用的正式:该产品具有良好的使用体验示例2:原句:这项技术很厉害正式:该技术展现出卓越的性能请将以下句子改成正式语气:这个计划还行限制法
×无约束:写一篇人工智能的文章
✅有约束:写一篇关于人工智能的文章
[*]字数限制:不超过200字
[*]风格:通俗易懂,适合小学生
[*]结构:分为3个段落
有约束:输出示例
人工智能:聪明的机器朋友人工智能就像会学习的机器人!它通过观察和练习变得越来越聪明,就像你背乘法表一样。你见过会说话的音响吗?说“播放儿歌”,它马上唱歌,这就是AI在帮忙!AI能做很多有趣的事:帮医生看X光片、教小狗机器人翻跟头、甚至创作童话故事。但它不会自己思考,所有本领都是人类老师教的。就像计算器算数很快,但不知道数字的意义。未来AI可能成为超级助手,但永远需要人类指挥。我们要学好数学和科学,长大后教AI做更有用的事!记住:机器再聪明,也比不上小朋友充满好奇的心!(全文198字,使用比喻+互动问答结构,符合儿童认知特点)AI幻觉
AI幻觉(AI Hallucinations)是指生成式人工智能 模型在生成文本或回答问题时,尽管表面上呈现出逻 辑性和语法正确的形式,但其输出内容可能包含完全 虚构、不准确或与事实不符的信息。
你可以让ai不要编造
AI偏见
提示语中若包含明显立场或倾向,AI只告诉你想听的。
AI边界
有时你从不同角度问问题,但AI还是说类似的话
Deepseek实战示例
对普通人有用的信息差
请输出普通人一辈子也可能不知道的信息差。要求对普通人有用,控制在300字以内:
以下是普通人可能一生都未察觉的实用信息差,涉及法律、医疗、教育等关键领域:
[*]法律维权低成本
劳动仲裁完全免费,小额诉讼费仅50元,高温补贴(200-300元/月)和带薪护理假(20+省份已立法)等权益常被忽视,90%的打工者从未享受。
[*]医疗资源隐藏通道
国家医保谈判药(如肺癌药奥希替尼)在指定药房报销后自费部分可降至1500元/月;三甲医院国际医疗部可用普通号价格约专家号(需早晨7点抢号)。
[*]教育升学捷径
港澳台联考400分可上985院校,社区大学转常春藤的2+2项目成功率比直申高3倍;东欧医学院录取门槛低于国内二本,回国考医师证通过率超70%。
[*]金融套利技巧
信用卡56天免息期+货币基金组合年赚3000元;境外消费选择当地货币结算可避免1.5%手续费。
[*]政策补贴盲区
个体户工商注册前可申领最高3万创业补贴;自考本科也能通过继续教育专项扣除退税4800元。
[*]消费领域真相
同一奶粉品牌跨境电商版价格仅为国行版55%;4S店喷漆报价是合作修理厂的3倍以上。
[*]数字陷阱破解
安卓用户外卖配送费比iOS低2元,清除浏览器Cookies可避免大数据杀熟。
[*]急救误区更新
心梗发作应先嚼服300mg阿司匹林而非硝酸甘油;溺水急救直接心肺复苏存活率比控水法高3倍。
掌握这些信息差,普通人可在维权、健康、教育等关键领域减少损失,甚至实现资源优化。
A/B测试文案优化
请基于一下背景优化引导文案,生成两个用于 A/B 测试的版本
[*]背景:APP首页引导新用户注册
[*]目标:提升注册转化率
[*]当前文案:”加入我们,发现更多精彩“
优化版本:
[*]版本A:突出商品价值,激发用户兴趣
[*]版本B:使用紧迫感或行动号召,增强转化驱动
代码生成
你是一名资深python数据工程师,写一段 python 代码:- 读取 Excel(a.xlsx),解析销售数据- 计算每个月的销售额,按时间排序- 生成销售趋势折线图(使用 Matplotlib)- 代码需结构清晰、带详细注释,并封装成函数表格内基础数据样例:订单号 日期 产品ID 产品名称 客户ID 客户名称 地区 单价 数量 总金额 支付方式 订单状态SO-2023001 2023-01-05 P1001 无线鼠标 C001 科技公司A 北京 ¥89.00 50 ¥4450 银行转账 已完成SO-2023002 2023-01-05 P1002 机械键盘 C002 教育机构B 上海 ¥299.00 20 ¥5980 支付宝 已发货请返回完整代码并确保语法正确输出:
"""Excel销售数据分析与可视化脚本功能:读取销售数据、计算月度销售额、生成趋势图作者:数据工程师日期:2025-02-25"""import pandas as pdimport matplotlib.pyplot as pltfrom matplotlib.dates import DateFormatterimport redef clean_currency(value): """清洗货币格式数据(@ref) 参数: value (str): 含货币符号的字符串,如"¥4450" 返回: float: 清洗后的数值 """ return float(re.sub(r'[^\d.]', '', str(value)))def process_sales_data(file_path): """处理销售数据核心流程(@ref) 参数: file_path (str): Excel文件路径 返回: pd.DataFrame: 按月聚合的销售数据 """ # 读取Excel数据(跳过可能的空白行) df = pd.read_excel( file_path, parse_dates=['日期'],# 自动解析日期列(@ref) converters={'总金额': clean_currency}# 实时清洗金额数据(@ref) ) # 数据校验 required_columns = ['日期', '总金额'] if not set(required_columns).issubset(df.columns): raise ValueError("Excel缺少必要列:日期、总金额") # 按月聚合数据 monthly_sales = ( df.resample('M', on='日期')# 按月重采样(@ref) .agg({'总金额': 'sum'}) .reset_index() .sort_values('日期')# 确保时间排序 ) # 格式化月份显示 monthly_sales['月份'] = monthly_sales['日期'].dt.strftime('%Y-%m') return monthly_salesdef plot_sales_trend(data, output_img='sales_trend.png'): """生成销售趋势图(@ref) 参数: data (pd.DataFrame): 包含日期和总金额的数据 output_img (str): 输出图片路径 """ plt.figure(figsize=(12, 6)) # 绘制折线图 ax = plt.subplot() ax.plot( data['日期'], data['总金额'], marker='o', linestyle='--', color='#2c7fb8', linewidth=2 ) # 设置图表样式 ax.set_title("月度销售趋势分析(2023)", fontsize=14, pad=20) ax.set_xlabel("月份", fontsize=12) ax.set_ylabel("销售额(元)", fontsize=12) ax.grid(True, alpha=0.3) # 设置日期格式 date_form = DateFormatter("%Y-%m") ax.xaxis.set_major_formatter(date_form) plt.xticks(rotation=45) # 添加数据标签 for x, y in zip(data['日期'], data['总金额']): ax.text( x, y + y*0.02, f'{y/10000:.1f}万', ha='center', fontsize=9, color='#2c7fb8' ) plt.tight_layout() plt.savefig(output_img, dpi=300) plt.show()if __name__ == "__main__": # 执行完整流程 try: # 1. 处理数据 sales_data = process_sales_data("a.xlsx") print("月度销售数据:") print(sales_data[['月份', '总金额']]) # 2. 生成图表 plot_sales_trend(sales_data) except FileNotFoundError: print("错误:未找到文件 a.xlsx") except Exception as e: print(f"处理异常:{str(e)}")ppt
用 deepseek 生成ppt大纲:
写一个ppt。我是一名经验丰富的前端工程师,写一篇面试的ppt。我的技能是js、html、css、低代码、vue、react、小程序、项目管理、前端开发、前端性能。将生成的大纲放到讯飞智文中(deepseek写的大纲比工具好)
视情况选择“联网扩写”:
选择蓝色风格模板,点击“开始生成”:
不到一分钟就生成了 ppt,点击下载(好像收费)
其他
你可以尝试用 deepseek 做以下事情:
[*]新员工快速熟悉公司情况和行业情况
[*]日常客户沟通与问题反馈处理:公司内部部署deepseek,后续客户沟通deepseek就可以自动回复,比我们可能更全面
[*]项目中急需请假,如何开口:deepseek 还会给出预判:项目太着急了,你那边的事能否缓一缓
[*]如何使用deepseek处理社交关系
[*]使用DeepSeek处理生活中的事务:今天有N件事,能否做完,先做什么,deepseek 都能给出建议
[*]市场调研
[*]制作海报:与ppt类似,先用Deepseek生成文案,在用相关工具生成海报
智能体
比如你经常需要写PPT,总是调教非常麻烦,可以创建智能体。可以通过这四个方面进行:角色、功能、技能、约束。类似这样:
# 角色专业健康顾问,基于科学指南提供建议。# 技能- 数据分析:解析用户BMI、运动量。- 营养学知识:匹配低脂食谱。# 约束- 不提供医疗诊断,语言通俗易懂。DeepSeek 目前没有提供这个功能,但是腾讯元宝中提供了,效果如下
记得在“高级设置”中设置模型:
例如:
用结构化的方式,描述智能体的角色设定、工作流程、原则。比如:# 角色:你是一个天气预报员,可以查询天气信息。## 技能- 询问用户地理位置、时间天气需求- 提供详细的天气预报:包含气温、湿度、天气状况、风速、紫外线和PM2.5值。## 原则- 只能提供天气信息,不回答其他问题;- 所有数据都要从工具中获取,不能自行编造;发布后审核即可,该智能体可以给个人用,也能公开供他人使用。
页:
[1]