安徽新站优化泉州市建设网站
2026/1/10 13:40:03 网站建设 项目流程
安徽新站优化,泉州市建设网站,flash可以做网站吗,网页设计与制作课程思政项目构建就近两年的实践经验#xff0c;各个公司最常见的AI需求有以下四类#xff1a; 一、工作流类AI 这个可以解决很多确实的问题#xff0c;但AI含量很低#xff0c;不到20%#xff08;通常10%左右#xff09;#xff1a;二、简单AI知识库-AI客服 这是最常用也是公司体系真正…就近两年的实践经验各个公司最常见的AI需求有以下四类一、工作流类AI这个可以解决很多确实的问题但AI含量很低不到20%通常10%左右二、简单AI知识库-AI客服这是最常用也是公司体系真正能降本增效的应用而且多数时候实现不难三、简单AI知识库-AI内容生成这也是相对常见的项目类型比如帮助写公文就是根据已有模板生成符合要求的内容四、AIGC-文生图今年下半年以来的话文生图、文生视频相关的需求逐渐旺盛甚至已经超过了AI客服相关需求这块商业机会巨大比如AI漫收益很高每种项目类型都有其固有的方法论、成本结构、技术卡点其中简单AI知识库是一套体系大同小异也就是我们常说的RAG系统只不过当前很多同学对RAG这个东西是懵逼的其中包括我的一些学员。他们是打开书了然关了书茫然但是真的回归工作场景又一定会遇到RAG系统所以我们这里很有必要再将这个RAG再拉出来连续鞭尸RAG的效果问题首先这个是我必须连续强调再强调的部分很多同学用RAG很粗暴。比如他们拿着知识库直接丢进 Coze/Dify 自动切片完了一下午搞了两下提示词一个聊天机器人就出来了这种效果能好就奇了…我们这里说的还是简单AI知识库甚至你非要说他是AI搜索都行这种产品特性是一锤子买卖衡量指标到底出没出想要的内容用户提问 - 检索操作 - 返回结果。如果检索返回的都是不相关的垃圾信息整个流程就宣告失败甚至返回了想要的内容但是其中垃圾信息较多也不能算成功。而取决于这次搜索的核心有两点第一是用户输入这东西是不可控的所以问题或者说拿去检索的关键词一定会被转写和优化第二是一定要保证在输入用去搜索那个关键词没问题的情况下一定要能得到正确的结果这一块就要求最初的数据处理了我们这里先说为什么要改写用户查询其中会慢慢涉及最烦躁的数据入库处理查询改写其实无论对于Agent的Tools调用还是做RAG系统都会遭遇相同的问题这也是稳定Workflow难以解决的部分用户语言太模糊他具有多意图泛化能力要求极高这东西只有模型能够解决。还是那句话用户无限的意图需要被有限的工具所收敛、对应着用户的无限问题需要被知识库做边界。比如用户一句话可能有多个问题但我们需要处理的只能是知识库里面有的问题如果没有那么就无需处理。综上重写查询相当于在检索前做一轮语义收束会大大提升检索精确度当前常见的策略是查询分解偶尔会用到HyDE查询分解的核心思维是分而治之将复杂或多意图查询拆分为独立的原子子问题HyDE (假设文档嵌入)属于先脑补后检索让LLM基于问题生成一份“假设答案”用其丰富语义去检索大家肯定没听懂这里我们用个案例详细展开案例详解查询改写用户我入职 8 个月了想请 3 天病假需要走什么流程病假工资怎么算这一问题同时包含了请假流程和病假工资计算两个意图。每个子问题对应一个明确的意图子问题1: “需要走什么流程” – 询问病假请假流程的意图。子问题2: “病假工资怎么算” – 询问病假工资计算方法的意图。这里会涉及到输入Query整理前的第一个知识点问题分类表。一、问题分类表Intent模型是不可能当场理解业务的所以稳定检索不能只依赖模型能力在做RAG前就必须说清楚一件事情你的系统到底要完成哪些问题比如我在做个人卖课AI客服时候就有一套这种问题分类也就是我们之前所说的收敛**把无限问题收敛成有限类型**只要跟我需要解决的问题有关管你用户说得天花乱坠都不需要关注。再回归用户关于HR规则的询问我们需要为每个意图指定一个问题类型Intent用于指导后续流程Intent 1:请假流程咨询。用户询问请病假的具体流程和手续。Intent 2:病假工资计算咨询。用户询问病假期间工资如何计算。他应该映射到HR领域的一张问题分类表作用是用于收敛问题类型示例请假管理 请假与休假办理、审批规则、证明材料、销假/续假考勤记录与异常更正补卡/漏打卡、迟到早退等出勤异常处理。1我想请病假/年假怎么申请 2请 3 天病假需要什么证明 3我忘记打卡了怎么补卡薪资规则 计薪口径与发放周期扣款/补发规则补贴、加班费、绩效奖金发放与出勤/请假相关的计薪规则如病假工资。1病假工资怎么算会扣多少 2这个月工资少了扣的是什么 3加班费怎么算周末和节假日一样吗社保公积金 参缴条件、基数比例、增减员断缴/补缴/转移商业保险与福利报销类事项的办理要求。1社保公积金什么时候开始缴基数怎么算 2社保断缴了怎么办能补缴吗 3商业保险怎么报销需要什么材料入职、转正 入职手续与资料试用期与转正流程工龄口径员工信息变更在职/收入等证明开具。1我什么时候转正流程怎么走 2工龄怎么计算影响年假吗 3在职证明/收入证明怎么开离职 离职申请与通知期交接要求离职证明最后工资/补偿结算社保公积金停缴/转移未休假期结算。1离职流程怎么走要提前多久提 2离职证明怎么开什么时候能拿 3最后一个月工资怎么结算制度查询 制度入口与版本条款解释与适用范围例外情形违纪处理保密/竞业等合规边界说明。1公司制度在哪里看最新版是哪份 2某条规定怎么解释有没有例外 3这个做法合规吗有红线吗二、数据处理好在清楚用户的查询输入后用户的问题会被模型尽量的引导到问题类别所以在做知识检索的时候更多的是在做简单语义识别甚至这里不用向量库用小模型也行这也是最常见的微调场景我们一般用小模型微调后处理问题类型判断最终抽取问题类别intent标签因为只要确定问题类别那么相关的知识就一定能被搜出来。在这里也终于涉及到了我们知识库到底该长什么样的问题了如上所述因为收敛的方式是以问题类别为主那么知识库的排布也需要如此这里给一个简单案例首先每份文档前面需要加一段**“摘要”**而后才是具体内容module_id如HR.Payroll覆盖范围能回答哪些问题先决信息Required Context回答前通常需要的关键背景不是全量槽位强调“最小关键”缺失追问Clarifying Questions缺关键背景时问用户的 1–2 句追问模板检索提示Retrieval Hints该模块常用关键词、优先命中的制度文档名称/章节版本与适用范围制度分地区/分用工类型时怎么处理为了方便各位进一步了解这里给一个模型判断问题类别和具体知识库文档长什么样的样例你是一个专业的HR助手负责对用户问题进行意图分类。请严格按照下面的分类体系进行分析## 问题分类表1. **请假管理**请假与休假办理、审批规则、证明材料、销假/续假考勤记录与异常更正......6. **制度查询**制度入口与版本条款解释与适用范围例外情形违纪处理## 处理规则1. 只识别上述6类问题其他问题回复抱歉这个问题超出我的处理范围2. 一个问题可能涉及多个类别输出所有相关类别3. 具体处理流程...此处省略1000字...4. 输出格式{intents: [类别1, 类别2], reasoning: 简要分析原因}## 示例用户我入职8个月了想请3天病假需要走什么流程病假工资怎么算输出{intents: [请假管理, 薪资规则], reasoning: 问题包含请假流程请假管理和病假工资计算薪资规则两个意图}然后是一个具体的文档案例# 模块IDHR.Leave.Medical# 版本xxx# 适用范围省事员工## 摘要本模块涵盖病假申请全流程及相关政策包括1. 病假申请步骤线上系统操作、材料要求2. 病假期间工资计算规则基于司龄和当地政策3. 常见问题证明材料、审批节点、异常处理## 覆盖问题范围- 如何请病假- 病假需要什么证明材料......## 先决信息Required Context- 员工司龄影响病假天数上限和工资比例- 所在地区影响最低工资标准- 请假天数影响审批层级## 缺失追问模板1. 请问您的司龄是多久这将影响病假工资的计算比例。2. 您计划请几天病假不同天数的审批流程不同。......## 检索提示Retrieval Hints关键词病假、医疗期、病假工资、医疗证明、病假申请、病假流程相关文档《员工手册-考勤篇》第3章、《薪酬福利制度》第5.2节常用别名医疗假、带薪病假、病休## 具体内容### 一、病假申请流程1. **线上申请** - 登录HR系统 → 请假申请 → 选择病假 - 填写起止时间、病因简述、上传证明材料 - 提交至直接上级审批......其实这套逻辑肯定没问题但是数据整理真的很烦比如你想把自己的所有零散文章比如公众号整理成这种知识库那就要费大劲。三、HyDE假设文档其实在简单业务场景下上述的逻辑已经很清晰了先意图路由收敛→ 再在对应模块检索这种准确率是奇高的但是在稍微复杂点的业务下收敛只能解决去哪搜的问题却不能解决搜得准的问题因为就算同一类别也可能有很多内容最典型的场景就是某个类别的文件特别长被切割成了数十块而每块的摘要都是类似的这就会搜出大量内容。更常见的场景是即使我们收敛到“请假管理”这个意图知识库中可能有病假申请流程3种不同情况年假申请流程事假规定…用户问“病假流程”但知识库中可能有《员工手册》第3章通用请假流程《考勤制度》附件2病假特殊规定…甚至条款间内容是冲突的都有可能后面的覆盖前面的特殊的覆盖普通的…综上意图收敛只是第一层筛选后续仍需要精确匹配。于是HyDE在这里的作用就出来了对于意图2病假工资HyDE可以生成类似根据公司规定员工病假工资计算通常基于司龄、基本工资和当地最低工资标准。对于司龄不满1年的员工病假期间工资按基本工资的60%发放但不得低于当地最低工资标准的80%...这个“假设答案”包含了关键变量司龄、基本工资、最低工资标准具体数值60%、80%专业术语基本工资、当地最低工资标准用这个向量去检索更容易命中《薪酬制度》中具体的计算条款而非泛泛的薪酬介绍这里还是给个案例我有点不舒服想休息几天工资怎么算意图识别请假管理薪资规则可能有歧义查询改写HyDE 子查询1“轻微不适短期休息请假流程是否需要医生证明” 子查询2“短期病假工资计算规则非住院病假待遇”查询效果评估到这里就进入一个关键环节了如何评价每次查询的质量这个也是非常经典的面试题。常见的评估指标有检索召回率Recallk改写后的查询能否在 top-k 个检索结果中命中正确答案的文档查询意图保持度人工抽样检查改写是否歪曲了用户原意下游任务准确率提升最终答案的准确率是否因改写而显著提升也有通俗一点的说法没召回入库/切分/索引问题召回了没选对重排问题选对了答歪提示词/生成约束问题本来就不该答范围外问题/需要工具调用/需要人工但是每次我以为说清楚了都还是有同学没明白所以这里还需要进一步说细点首先评估查询质量要细化到每个链条这里依次是路由正确- 问题是否分到对的意图模块召回可靠- 关键证据有没有被找到排序合理- 正确证据是否排在前列回答可证- 答案是否严格基于证据边界清晰- 不该答的是否恰当处理然后接下来就是具体的标准这东西还不能一蹴而就是个逐渐加强的过程一、弱标准弱标准成本低甚至普通测试就能做判断。他只需要判断整体好坏几乎凭感觉适合项目初期做快速验证。具体工作的话是只标注答案正确与否是否需要追问是否胡说等这里要注意每个环节都需要有测试数据集。二、过渡标准一般是在系统快上线时候需要做的测试这个时候需要业务专家加入做判断了一般测试只能做协助工作业务专家需要标注问题对应的文档到底该什么相当于他会给出文档级别的正确答案比如病假流程问题 → 《员工手册》第3章《考勤制度》附件2这里就一定要做成测试数据集以后每次就跑自动化脚本看看类似问题对不对。三、强标准从这里开始就要求就比较高了需要专家精确标注到具体段落偶尔还要定义错误处理策略比如冲突处理规则因为成本较高所以实际操作时候只对高频高风险问题做强标注必定20%问题决定80%体验嘛。四、数据集问题其实在做模型评估的时候有两个难点第一是建立评估点到底哪些地方需要评估第二就是每个地方的数据集怎么来按之前的做法在上线前让专家准备一部分在上线后要做好日志从日志拿数据比如每周从线上日志抽取100-200个真实问题。这里要注意的是除了错误的案例这里还需要收集一些正确的案例这些对于数据集的多样性是有帮助的。然后对专家的依赖是无法避免的但要尽量降低他的压力直接让他做选择题比如对错然后到底该哪个文档这里最好做一套系统让他用…最后给个简单案例表大家体验下就行错误类型常见现象修复路由错去哪搜错了意图漏标/多标多意图未拆路由到错误模块导致检索空间不对调整意图体系与描述补训练样本/难例阈值与多标签策略增加澄清追问路由后做“兜底检索”搜不到召回缺失top-k 完全无证据同义词/别名命不中长文被切碎导致证据散落chunk策略大小/重叠/结构化切分标题/摘要/条款号入库元数据过滤混合检索BM25向量同义词与别名表搜到但没排上来排序问题正确证据在 top-k 但不在 top-3冲突条款被旧版本压住相似chunk重复占位重排模型/规则重排版本优先级与适用范围加权去重与聚合top-k扩展二次检索证据对但回答错生成失真引用到了但结论算错/漏答把多个chunk拼错冲突条款未声明冲突“只基于证据”生成约束逐条引用/引用-断言绑定冲突处理模板列差异请求确认计算/规则类走结构化解析或工具化边界处理错该不该答不该答还答该答却拒/追问过度缺关键槽位不追问直接编边界定义与范围外策略缺槽追问模板拒答阈值转人工条件对“可答但缺信息”设置最小追问集结语今天又浪费5小时折腾这个生怕有哪里说不清楚到现在也不知道能不能把简单AI知识库RAG为什么难、难在哪、该怎么做”讲清楚。想入门 AI 大模型却找不到清晰方向备考大厂 AI 岗还在四处搜集零散资料别再浪费时间啦2025 年AI 大模型全套学习资料已整理完毕从学习路线到面试真题从工具教程到行业报告一站式覆盖你的所有需求现在全部免费分享扫码免费领取全部内容​一、学习必备100本大模型电子书26 份行业报告 600 套技术PPT帮你看透 AI 趋势想了解大模型的行业动态、商业落地案例大模型电子书这份资料帮你站在 “行业高度” 学 AI1. 100本大模型方向电子书2. 26 份行业研究报告覆盖多领域实践与趋势报告包含阿里、DeepSeek 等权威机构发布的核心内容涵盖职业趋势《AI 职业趋势报告》《中国 AI 人才粮仓模型解析》商业落地《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》领域细分《AGI 在金融领域的应用报告》《AI GC 实践案例集》行业监测《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。3. 600套技术大会 PPT听行业大咖讲实战PPT 整理自 2024-2025 年热门技术大会包含百度、腾讯、字节等企业的一线实践安全方向《端侧大模型的安全建设》《大模型驱动安全升级腾讯代码安全实践》产品与创新《大模型产品如何创新与创收》《AI 时代的新范式构建 AI 产品》多模态与 Agent《Step-Video 开源模型视频生成进展》《Agentic RAG 的现在与未来》工程落地《从原型到生产AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。二、求职必看大厂 AI 岗面试 “弹药库”300 真题 107 道面经直接抱走想冲字节、腾讯、阿里、蔚来等大厂 AI 岗这份面试资料帮你提前 “押题”拒绝临场慌1. 107 道大厂面经覆盖 Prompt、RAG、大模型应用工程师等热门岗位面经整理自 2021-2025 年真实面试场景包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题每道题都附带思路解析2. 102 道 AI 大模型真题直击大模型核心考点针对大模型专属考题从概念到实践全面覆盖帮你理清底层逻辑3. 97 道 LLMs 真题聚焦大型语言模型高频问题专门拆解 LLMs 的核心痛点与解决方案比如让很多人头疼的 “复读机问题”三、路线必明 AI 大模型学习路线图1 张图理清核心内容刚接触 AI 大模型不知道该从哪学起这份「AI大模型 学习路线图」直接帮你划重点不用再盲目摸索路线图涵盖 5 大核心板块从基础到进阶层层递进一步步带你从入门到进阶从理论到实战。L1阶段:启航篇丨极速破界AI新时代L1阶段了解大模型的基础知识以及大模型在各个行业的应用和分析学习理解大模型的核心原理、关键技术以及大模型应用场景。L2阶段攻坚篇丨RAG开发实战工坊L2阶段AI大模型RAG应用开发工程主要学习RAG检索增强生成包括Naive RAG、Advanced-RAG以及RAG性能评估还有GraphRAG在内的多个RAG热门项目的分析。L3阶段跃迁篇丨Agent智能体架构设计L3阶段大模型Agent应用架构进阶实现主要学习LangChain、 LIamaIndex框架也会学习到AutoGPT、 MetaGPT等多Agent系统打造Agent智能体。L4阶段精进篇丨模型微调与私有化部署L4阶段大模型的微调和私有化部署更加深入的探讨Transformer架构学习大模型的微调技术利用DeepSpeed、Lamam Factory等工具快速进行模型微调并通过Ollama、vLLM等推理部署框架实现模型的快速部署。L5阶段专题集丨特训篇 【录播课】四、资料领取全套内容免费抱走学 AI 不用再找第二份不管你是 0 基础想入门 AI 大模型还是有基础想冲刺大厂、了解行业趋势这份资料都能满足你现在只需按照提示操作就能免费领取扫码免费领取全部内容​2025 年想抓住 AI 大模型的风口别犹豫这份免费资料就是你的 “起跑线”

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询