网站建设相关职业岗位职责如何做商业推广网站
2026/1/13 6:30:06 网站建设 项目流程
网站建设相关职业岗位职责,如何做商业推广网站,移动互联网网站建设,世界500强企业中国有哪些编辑部 整理量子位 | 公众号 QbitAI清华教授唐杰最新在微博发表了自己关于AI的一些感悟#xff0c;非常值得一读#xff5e;共八个小点#xff0c;不算长篇大论#xff0c;但扎实有料#xff1a;基座模型继续scaling仍然高效#xff1b;真实使用体验想进一步上台阶#…编辑部 整理量子位 | 公众号 QbitAI清华教授唐杰最新在微博发表了自己关于AI的一些感悟非常值得一读共八个小点不算长篇大论但扎实有料基座模型继续scaling仍然高效真实使用体验想进一步上台阶长尾能力的对齐和推理增强绕不过去Agent代表模型开始进入环境、开始形成生产力一旦模型进入持续交互的世界记忆机制、在线学习、自我评估就会成为核心工程题而不是可选项AI终究要落到替人完成工作、创造增量价值上领域大模型是个伪命题……唐杰表示发微博是想分享一下希望对大家有用。兹以推文刊载供大家广泛阅读、传播。以下为其感悟原文01关于scaling基座模型预训练使得大模型已经掌握世界常识知识并且具备简单推理能力。更多数据、更大参数和更饱和的计算仍然是scaling基座模型最高效的办法。02关于激活对齐和增强推理能力激活对齐和增强推理能力尤其是激活更全面的长尾能力是保证模型效果的另一关键通用benchmark的出现一方面评测了模型通用效果但也可能使得很多模型过拟合。真实场景下是如何让模型更快、更好的对齐长尾的真实场景增强实际体感。mid和post training使得更多场景的快速对齐和强推理能力成为可能。03关于Agentagent是模型能力扩展的一个里程碑也是体现ai模型进入人类真实虚拟/物理世界的关键。没有agent能力大模型将停留在理论学习阶段就类似一个人不断学习哪怕学习到博士也只是知识积累还没有转化为生产力。原来的agent是通过模型应用来实现现在模型已经可以直接将agent数据集成到训练过程增强了模型的通用性其实难题还是不同agent环境的泛化和迁移并不是那么容易因此最简单办法也只有不断增加不同agent环境的数据和针对不同环境的强化学习。04关于模型记忆实现模型记忆成为一个必须做的事情这也是一个模型应用到真实环境必须有的能力。人类记忆分为短期前额叶、中期海马体、长期分布式大脑皮层、人类历史wiki或史书四个阶段。大模型如何实现不同阶段的记忆是个关键context、rag、模型参数可能分别对应了人类的不同记忆阶段但如何实现是个关键一种办法是压缩记忆简单存在context如果大模型可以支持足够长的context那基本有可能实现短中长期的记忆。但如何迭代模型知识更改模型参数这还是个难题。05关于在线学习与自我评估在线学习与自我评估。有了记忆机理在线学习成为一个重点目前的大模型定时重新训练这有几个问题模型无法真正的自我迭代但模型的自学习自迭代一定会是下一个阶段必然具有的能力重新训练还比较浪费同时也会丢掉很多交互数据。因此如何实现在线学习是个关键自我评估是在线学习的一个关键点要想模型自我学习模型首先要知道自己对还是不对如果知道了哪怕概率知道模型就知道了优化目标能够自我改进。因此构建模型自我评价机制是个难题。这也可能是下一个scaling范式。continual learning/real time learning/online learning06关于模型研发和应用结合最后大模型的发展越来越端到端不可避免的要把模型研发和模型应用结合起来。ai模型应用的第一性不应该是创造新的app他的本质是agi替代人类工作因此研发替代不同工种的ai是应用的关键。chat部分替代了搜索部分其实融合了情感交互。明年将是ai替代不同工种的爆发年。07关于多模态和具身写在最后的是多模态和具身。多模态肯定是个未来也很有前景当下的问题是多模态不大能帮助到agi的智能上界而通用agi的智能上界到底在哪儿还不知道。可能最有效的方式还是分开发展文本、多模态、多模态生成。当然适度的探索这三者的结合肯定能发现一些很不一样的能力这需要勇气和雄厚的资本支持。同理如果看懂了agent就知道具身的痛在哪里了太难通用了也不一定但至少少样本去激活通用具身能力基本不可能。那怎么办呢采数据或者合成数据都不是那么容易也贵。但反之一旦数据规模上去了通用能力出来了自然会形成门槛。当然这只是智能方面的难题对于具身机器人本身也是个问题不稳定故障频繁都限制了具身智能的发展。2026年这些都将取得长足进步。08关于领域大模型和大模型应用也讨论一下领域大模型和大模型应用。我一直认为领域大模型就是个伪命题都agi了哪有什么domain-specific agi……但agi还没实现领域模型会长时间存在多长不好说ai发展实在太快了。领域模型的存在本质上是应用企业不愿意在ai企业面前认输希望构建领域know how的护城河不希望ai入侵希望把ai驯化为工具。而ai的本质是海啸走到哪里都将一切卷了进去一定有一些领域公司走出护城河自然就卷进了agi的世界。简而言之领域的数据、流程、agent数据慢慢的都会进入主模型。而大模型的应用也要回到第一性原理ai不需要创建新的应用。ai的本质是模拟人或者代替人或者帮助人实现人类的某些必须要做到事某些工种。可能就是两种一种就是ai化以前的软件原来需要人参与的改成ai另一种就是创造对齐人类某个工种的ai软件替代人类工作。所以大模型应用需要帮助到人、创造新的价值。如果做一个ai软件没人用不能产生价值那这个ai软件肯定没有生命力。参考链接https://weibo.com/2126427211/5247011059141988一键三连「点赞」「转发」「小心心」欢迎在评论区留下你的想法—完—

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询