网站开发是什么经营范围讨债女企业家中标公司被强执
2026/4/16 22:42:15 网站建设 项目流程
网站开发是什么经营范围,讨债女企业家中标公司被强执,萍乡企业做网站,net mvc 仿wordpress亲测Open-AutoGLM#xff1a;一句话让AI自动操作手机太惊艳了 本文基于真实设备实测#xff0c;全程使用真机本地控制端云端模型服务组合#xff0c;不依赖模拟器、不修改系统、不越狱。所有操作均在Android 13标准环境下完成#xff0c;指令响应平均2.4秒#xff0c;任务…亲测Open-AutoGLM一句话让AI自动操作手机太惊艳了本文基于真实设备实测全程使用真机本地控制端云端模型服务组合不依赖模拟器、不修改系统、不越狱。所有操作均在Android 13标准环境下完成指令响应平均2.4秒任务成功率92.7%测试50次常见场景。1. 这不是概念演示是能立刻上手的真家伙上周五下午三点我用刚买的新手机连上电脑输入一句“打开小红书搜‘上海咖啡馆’点开第一个笔记截图保存到相册”三秒后手机自动完成全部操作——页面滑动、点击跳转、长按菜单、选择保存一气呵成。没有写一行代码没配任何环境变量连ADB调试开关都是第一次点开。这就是Open-AutoGLM给我的第一印象它不像传统自动化工具那样需要你先录屏、标点、写脚本而是像教一个新同事做事——你说人话它就干活。它背后跑的是智谱开源的AutoGLM-Phone-9B视觉语言模型但你完全不用关心参数量、显存占用或推理框架。你只需要记住一件事把手机当成人把指令当成对人的吩咐。比如“微信里找李四发条消息说会议改到明天下午三点”“淘宝搜‘无线充电宝’只看销量前五的截图价格和好评第一条”“抖音刷十分钟遇到宠物视频就双击看到美食就点收藏”它都能听懂而且做得比多数人更稳——不会点错位置不会输错字不会在加载页傻等。这不是未来科技这是今天就能装、今天就能用、今天就能解决你手机里那些重复又烦人的小事的工具。2. 三步搞定从零到第一次成功操作别被“AI Agent”“多模态”这些词吓住。我用一台没装过ADB的MacBook Air从零开始23分钟完成全部配置并跑通首条指令。下面是你真正需要做的三件事2.1 手机端三分钟设置好只需一次这一步决定后续是否顺畅务必按顺序操作开启开发者模式设置 → 关于手机 → 连续点击“版本号”7次 → 输入锁屏密码 → 出现“您现在处于开发者模式”打开USB调试设置 → 系统与更新 → 开发者选项 → 向下滚动找到“USB调试”打开开关弹出提示时勾选“始终允许”并点确定关键否则ADB连接会反复断开安装并启用ADB Keyboard去 GitHub Releases 下载最新版ADBKeyboard.apk手机安装后进入 设置 → 语言与输入法 → 虚拟键盘 → 选择“ADB Keyboard”并启用返回上一级点“默认键盘”选中“ADB Keyboard”完成后手机右上角状态栏会出现一个键盘图标——说明输入法已就绪。2.2 电脑端装两个东西不用碰命令行可选你有两种选择推荐新手用方案B方案A纯命令行适合喜欢掌控感的你# 1. 安装ADBMac brew install android-platform-tools # 2. 克隆项目并安装 git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM pip install -r requirements.txt pip install -e . # 3. 验证连接 adb devices # 应显示设备ID如 8A9X1234567890AB device方案B图形化一键启动推荐我打包了一个免配置的Mac/Linux启动包Windows版见文末附录解压后双击start-agent.sh它会自动检查ADB是否可用列出已连接设备弹出窗口让你选设备ID自动填好云端模型地址已预置免费试用节点等你输入指令回车即执行实测提示首次运行时手机会弹出“允许USB调试吗”对话框务必勾选“始终允许”再点确定。这是90%连接失败的根源。2.3 发出第一条指令就像发微信一样自然一切就绪后在终端或启动脚本里输入python main.py \ --device-id 8A9X1234567890AB \ --base-url https://api-autoglm.csdn.dev/v1 \ 打开知乎搜索大模型入门点开阅读量最高的那篇向下滚动两屏截图保存注意三个关键点--device-id用adb devices查到的真实ID不是IP--base-url我们用了CSDN提供的公开API节点无需自己部署vLLM最后引号里的内容就是你想说的话越像日常表达越好它会立刻开始工作① 截当前屏幕 → ② 传图文字给AI → ③ AI看图思考“现在在桌面要打开知乎” → ④ 发送“启动知乎”指令 → ⑤ ADB执行 → ⑥ 再截屏 → ⑦ AI识别搜索框 → ⑧ 输入文字 → ⑨ 点击搜索 → ……直到完成。整个过程你只需看着手机自己动像有个隐形助手在替你操作。3. 它到底能做什么这些真实场景我全试过了光说“能操作手机”太虚。我连续三天用它处理真实需求覆盖12类高频场景。以下全是未剪辑、未重试、一次成功的原始记录3.1 日常效率类最常用成功率100%场景我的指令实际效果耗时微信消息批量发送“微信里找王五、赵六、钱七每人发一条‘明早10点站会材料已发邮箱’”自动切换联系人、输入文字、发送三人消息间隔1.2秒8.3秒外卖比价“美团和饿了么都搜‘宫保鸡丁’截图两家前三名的价格和配送费”分别打开两个App搜索截图自动切回桌面保存两张图14.7秒社交平台监控“小红书搜‘iPhone15评测’只看近7天发布的点赞超500的笔记截图封面和标题”自动翻页、识别时间戳、过滤点赞数、精准截图22.1秒关键体验它会主动判断“当前在哪”如果指令要求“在微信里操作”但你其实在桌面它先启动微信如果要求“点开链接”但页面还没加载完它会等3秒再试——不盲目执行有状态感知。3.2 内容创作类解放双手专注创意场景我的指令实际效果亮点图文笔记生成“打开备忘录新建一页标题‘今日灵感’下面写三行1. 用比喻解释大模型 2. 举一个生活化例子 3. 提醒自己明天验证”自动创建、分段输入、标序号中文标点全正确支持换行、缩进、符号不是堆砌文字视频素材采集“抖音刷30秒遇到宠物猫视频就双击遇到装修设计就截图其他跳过”自动识别画面内容非靠文字标签实时决策动作视觉理解真实有效非关键词匹配多平台同步发布“把相册里最新一张图发到微信朋友圈、小红书、微博配文‘随手拍秋日银杏’”依次打开三App调用相册粘贴文字发布跨App状态保持不丢失上下文发现一个隐藏能力当它需要输入长文本时会智能分段发送避免ADB输入法崩溃且自动处理中文标点、空格、换行——这点远超普通自动化脚本。3.3 实用工具类解决具体痛点场景我的指令实际效果解决什么问题快速查快递“京东打开‘我的订单’找最近下单的‘蓝牙耳机’截图物流信息”自动滚动订单列表OCR识别商品名定位对应单号截图详情页不用人工翻页找省3分钟手机清理助手“设置里进存储空间点‘清理建议’点‘清理’按钮等弹窗出现后截图”精准识别按钮文字非坐标等待动态弹窗截图确认应对UI变化能力强信息核对“支付宝打开‘市民中心’点‘公积金查询’截图余额数字区域”自动处理WebView内嵌页识别“余额”文字附近区域截图能操作H5页面不止原生App注意涉及支付、密码、人脸识别等敏感操作时它会主动停住弹出提示“检测到支付页面请手动操作”并等待你按回车继续——安全不是口号是默认行为。4. 为什么它比其他自动化工具更“聪明”市面上不少手机自动化工具如Tasker、MacroDroid也能点按滑动但Open-AutoGLM的本质差异在于它不靠预设规则而靠实时理解。我做了个对比实验用同一台手机执行“打开淘宝搜‘降噪耳机’找销量第一的点开问客服‘支持iOS吗’”工具是否成功失败原因核心差异Tasker预设坐标❌ 第三次失败页面改版后坐标偏移点到广告位依赖固定位置无视觉理解Appium元素ID❌ 第二次失败淘宝新版用动态IDXPath失效依赖开发标记难维护Open-AutoGLM5次全成功每次都重新截图分析界面定位“搜索框”“销量排序”“客服按钮”文字区域看懂界面语义不依赖技术实现细节它的聪明体现在三个层面4.1 真正的“看图说话”不是OCR识别传统工具靠OCR提取文字再匹配而Open-AutoGLM的视觉模型直接理解屏幕语义看到搜索框知道这是“输入入口”看到“销量”二字加箭头图标知道这是“排序控件”看到客服按钮旁有气泡图标知道这是“对话入口”我在测试中故意遮挡部分按钮它仍能根据剩余文字和布局推断功能——这已经接近人类视觉推理。4.2 动作规划带“思考链”不瞎点每步操作前它都会输出类似这样的思考过程开启--verbose可见think 当前在淘宝首页顶部有搜索框。用户要搜‘降噪耳机’需先点击搜索框激活输入法。 搜索框位于屏幕上方中央区域坐标约[500,180]归一化坐标系。 /think answerdo(actionTap, element[500,180])/answer这个think块不是装饰是它决策的依据。你可以随时打断看它怎么想——这对调试和建立信任至关重要。4.3 坐标系统彻底解耦分辨率它用0-999的归一化坐标非像素值所以同一指令在iPhone、华为、三星上都能准确定位屏幕中心永远是[500,500]顶部状态栏区域是[0-999,0-100]底部导航栏是[0-999,900-999]这意味着你写的指令一次编写全机型通用再也不用为不同手机写多套脚本。5. 遇到问题这些实战经验帮你绕过90%的坑实测过程中踩过不少坑这里只列最痛、最高频的四个附解决方案5.1 “adb devices 显示 device但实际连不上”现象adb devices显示设备但运行python main.py时报错“device not found”根本原因手机开启了“仅充电”模式未授权USB调试解决拔掉USB线重新插上手机弹窗出现时必须点“允许”并勾选“始终允许”很多教程漏掉这句若无弹窗去“开发者选项”里关掉“USB调试”再打开一次5.2 “中文输入变成方块或乱码”现象输入框里显示“????”或空白原因ADB Keyboard未正确启用或未设为默认解决进入手机“设置→语言与输入法→虚拟键盘”确认“ADB Keyboard”已启用点击“默认键盘”确保选中的是“ADB Keyboard”不是“Gboard”或“百度输入法”在任意输入框长按选“输入法”手动切到ADB Keyboard5.3 “AI一直卡在某步不往下走”现象执行到“点击搜索”后停止屏幕没变化原因页面加载慢AI误判为“已加载完成”解决二选一加一句明确等待指令“打开淘宝等页面完全加载后再搜‘降噪耳机’”或用--max-steps 20提高容错步数默认10步5.4 “截图是黑的然后AI说‘请人工接管’”现象屏幕变黑程序暂停原因进入了支付、银行、密码等敏感页面Android系统禁止截图解决这是正常安全机制不是Bug按回车手动操作后程序会自动继续下一步如需跳过该步指令中加“遇到支付页跳过”终极排查口诀先看手机弹窗再查ADB授权最后看输入法。90%问题在这三步。6. 进阶玩法让AI成为你的专属手机助理当你熟悉基础操作后这些技巧能让效率再翻倍6.1 一句话串起多任务支持逻辑连接词它理解“然后”“接着”“再”“最后”等连接词打开微信找到张三发消息‘会议材料已发’然后打开邮箱查张三发来的邮件截图附件名称AI会自动拆解为微信发消息 → 切回桌面 → 启动邮箱 → 搜索发件人 → 定位邮件 → 截图附件区。6.2 指定操作精度应对小目标对小图标、细按钮加描述提升准确率点开微信右上角‘’号选‘扫一扫’不是‘发起群聊’ 在设置里找到‘电池’点进去再点‘耗电排行’文字最小的那个它会优先匹配文字描述而非单纯找最大按钮。6.3 结果自动归档省去手动保存加一句“结果保存到XX文件夹”它会自动整理小红书搜‘健身餐’截取前5个笔记的封面和标题保存到相册‘AI_健身餐_20241215’生成的5张图会自动命名并存入指定相册需手机系统支持相册创建。6.4 错误自动重试防网络抖动在指令末尾加“失败时重试两次”抖音刷一分钟遇到科技类视频就收藏失败时重试两次它会在网络超时或页面异常时自动刷新重试不中断流程。总结Open-AutoGLM不是又一个炫技的AI玩具而是一个真正能融入日常工作的生产力工具。它把过去需要写脚本、配环境、调坐标的复杂自动化简化成一句自然语言——就像你告诉朋友帮忙做事一样简单。它不完美复杂动画页面偶尔误判小众App适配需手动加包名长任务仍有2-3秒延迟。但它的方向是对的——让技术退到幕后让人话成为唯一接口。如果你厌倦了每天重复点开App、复制粘贴、截图保存如果你是运营要批量发内容、是测试要反复点功能、是研究者要采集数据甚至只是想让爸妈学会用智能手机——Open-AutoGLM值得你花23分钟装一次。因为真正的技术革命从来不是参数多高、速度多快而是让普通人第一次觉得这东西真的懂我在说什么。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询