ChatGPT Web Agent 是一套运行在 Win11 本地的网页版智能代理系统。它以 ChatGPT 网页作为决策核心,本地工具层负责真实执行,把浏览器、桌面窗口、文件系统、命令行和长期记忆整合进同一套工作流里。
它支持浏览器自动化,包括打开网页、点击、输入、抓取正文、截图和多步页面流程;支持桌面自动化,包括窗口枚举、控件识别、聚焦、点击、输入和快捷键;支持文件与命令执行,包括读写文件、整理目录、调用 PowerShell、运行脚本和启动程序;支持高性能输入兜底,使用 Win32 SendInput 处理鼠标和键盘动作。
系统内置长期记忆与状态管理,能够保存任务历史、执行记录、相关经验和浏览器会话,重新启动后仍可延续工作。浏览器使用独立持久化 profile,登录状态、Cookie 和本地存储可长期复用。整体还具备自愈和熔断能力,可在页面关闭、动作重复或连续失败时自动调整流程。
一句话概括:它不是简单脚本,而是一套把 ChatGPT 网页、本地执行能力和长期记忆结合起来的 Win11 智能代理框架。