2026/1/1 22:25:03
网站建设
项目流程
想在拼购网站做产品,网络营销课程心得体会300字,wordpress判断分类,wordpress分类发布文章之所以会想写这个#xff0c;首先是因为在知乎收到了这个推荐的问题#xff0c;实际上不管是 AutoGLM 还是豆包 AI 手机#xff0c;会在这个阶段被第三方厂商抵制并不奇怪#xff0c;比如微信和淘宝一直以来都很抵制这种外部自动化操作#xff0c;而非这次中兴的 AI 豆包手…之所以会想写这个首先是因为在知乎收到了这个推荐的问题实际上不管是 AutoGLM 还是豆包 AI 手机会在这个阶段被第三方厂商抵制并不奇怪比如微信和淘宝一直以来都很抵制这种外部自动化操作而非这次中兴的 AI 豆包手机出来才抵制毕竟以前搞过微信自动化客服应该都知道一不小心就会被封号。另外也是刚好看到 B 站的 UP 主老戴深入分析了豆包手机的内部工作机制的视频视频介绍了从 AI 助手如何读取屏幕、捕捉数据和模拟操作的真实流程所以对于 AI 手机又有了个更深刻的认知在这个基础上更不难理解为什么 AI 手机这种自动化 Agent 会被第三方厂商抵制推荐大家看原视频https://b23.tv/pftlDX8 。那么豆包的 AI 手机是怎么工作的呢实际上和大家想的可能不一样它并没有使用无障碍服务Accessibility Service而是使用了更底层的实现方案豆包手机利用底层的系统权限直接从 GPU 缓冲区获取原始图像数据并注入输入事件而非依赖截屏或无障碍服务此外手机还在一个独立的虚拟屏幕中执行后台任务并将图像低频发送至云端进行推理云端则返回操作指令。在视频里 UP 主通过深度拆解豆包手机分析手机在系统层面的服务分工、数据抓取和模型推理路径例如aikernel被 UP 主推断为手机端侧 AI 的核心进程内存占用特性Native堆高达160M表明它可能是一个本地AI推理框架另外aikernel异常高的Binder数量证明有大量外部进程通过 RPC 调用它进一步印证了其系统级服务的角色 。而autoaction是豆包手机 AI 自动操作的关键这个 APK 权限允许直接从 GPU 渲染的图形缓冲区读取数据而不是通过上层截图而且目前看豆包手机的 AI 能够捕获受保护的视频输出这意味着它可以绕过银行 App 等应用的反截图/录屏限制因为很多银行 App 很多是通过 DRM数字版权管理 或应用内安全设置来防止截屏和录屏另外Agent 在操作手机过程也不是直接使用系统的 Accessibility Service 而是通过调用系统隐藏APIinjectInputEvent来控制手机 AI 通过INJECT_EVENTS权限直接注入输入事件来模拟屏幕点击权限高于无障碍 API并且是系统签名同时豆包手机在执行自动操作时会利用一个与物理屏幕分辨率相同的“无头”虚拟屏幕在后台运行且拥有独立的焦点不影响用户在前台的操作这其实就是内存副屏的概念 虚拟屏幕的画面由 GPU 合成后对应的缓冲区信息会直接被autoaction消费再次证实 AI 无需通过截图 API 即可获取屏幕内容 最后豆包手机在自动化操作时会频繁地每3到5秒与obriccloud.com字节的服务 服务器通信发送约 250K的单帧图片进行推理。云端在接收图片后会返回约 1K 的数据内容是告诉手机下一步要执行的 7 种指令之一如打开应用、点击、输入、滑动等等整个自动化 Agent 的推理和路径规划主要在云端完成云端思考后将执行步骤指令发回本地执行本地任务很轻那么这整个过程你看下来有什么感觉如果你是第三方厂商你会不会同样抵制这种数据收集和处理的行为特别是绕过现有大家对系统 API 的理解这种操作途径是否能被友商们接受所以目前的这种操作被微信和淘宝抵制很正常不管是隐私的边界还有安全操作的规范用户对于自己某个产品内容被收集的信息程度这些都还处于蛮荒状态数据安全和隐私的边界范围还不可控并且 Agent 的托管行为也明显侵犯到了友商们的利益链条。就像是 UP 主说的AI Agent 的出现将动摇移动互联网的底层商业逻辑——注意力经济使“注意力”这一硬通货的重要性降低 实际上换作另一个概念就是碎片化时间以前你的碎片化时间都是被各种 App 消费了比如广告和沉浸引导但是 Agent 的出现它明显将这部分时间给托管了那么数据和时间都被 Agent 服务收集对于友商们来说不就是成了单纯的功能性服务商了吗另外说实话像 AutoGLM 这种功能目前的支持最大受益者不是用户而是灰产不管是用诈骗还是黄牛他们都是这种自动化下的第一受益者所以规范和监管特别是安全和隐私条款是必须比如就像 UP 主说的豆包手机的 AI 在自动化操作过程中哪些数据会被发送到云端服务器很多人对于 agent 和自动化能力的范畴并不理解它们可以获取隐私的边界是什么安全操作的规范是什么这些都是需要支持和统一边界。比如 Android 16 实际上官方是有规划 Appfunction Api 的它的目的是让应用只公布自己开放给 AI 的能力这样也许边界感更强。当然从历史的角度看Agent 手机势不可挡就像谷歌自己未来新的 Android PC 系统 Aluminium OS 也是会结合 Gemini Agent 等特点这是历史进程的必然但是这个过程中如何统一规范和监管这是很重要的过程毕竟 AI 的效应和能力可比之前更加强就像 UP 主说的新的 AI 寡头可能会形成更中心化、更强势的权力且马太效应更明显。那么你觉得未来谁家的 Agent 设备会成为新时达的寡头或者不是手机而是眼镜视频链接https://b23.tv/pftlDX8