TuriX-CUA 是什么
turix-cua 是一款基于 python 构建的开源 ai 智能体,专注于实现桌面级自动化操作。它通过实时截取屏幕画面来“观察”当前界面,再借助多模态大语言模型进行理解与决策,从而精准执行用户下达的任务指令,例如信息检索、文档编辑、表格处理等。该工具原生支持 windows 与 macos 双平台,具备良好的模型兼容性,并可通过 mcp(model communication protocol)协议与其他 ai 工具无缝对接,助力构建高阶自动化工作流,为用户提供更智能、更高效的本地化操作体验。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

TuriX-CUA 的核心能力
- 视觉感知与交互控制:利用屏幕截图识别 UI 元素,精准模拟鼠标点击、拖拽及键盘输入,完成端到端的桌面自动化操作。
- 多模态任务闭环处理:可胜任机票预订、网页信息提取、图表生成、文档内容插入等多样化、跨应用的复杂任务。
- 双模块协同架构:采用 Planner(任务规划器)与 Executor(操作执行器)分离设计,显著提升任务拆解合理性与执行鲁棒性。
- 全平台适配能力:深度优化 Windows 和 macOS 系统底层接口调用逻辑,确保在不同操作系统下均稳定运行。
- MCP 协议开放集成:支持与 Claude、GPT 等主流 AI 引擎通过标准 MCP 协议通信,拓展协作边界与场景覆盖范围。
- 模型即插即用机制:允许用户自由切换后端推理模型,包括云端 API(如 OpenAI)或本地部署的多模态模型(如 Qwen3-VL),兼顾性能与隐私需求。
- 智能任务分解引擎:由 Planner 对高层目标进行语义解析与步骤拆分,再交由 Executor 逐项落实,保障长周期任务的完整性与成功率。
TuriX-CUA 快速上手指南
- 环境搭建:安装 Python 及 Conda 工具链,创建独立虚拟环境并拉取项目依赖库。
- 模型接入配置:在 config.yaml 或对应配置文件中填写所选 AI 模型的访问密钥、API 地址及参数设定,并明确任务目标描述。
- 系统权限授权:在操作系统中开启屏幕录制、辅助功能、输入监控等必要权限,确保 Agent 能合法访问和操控桌面资源。
-
启动智能体服务:执行主入口脚本(如
main.py或run_agent.py),使 AI 开始监听任务指令并自动响应。 - 任务定制优化:依据具体业务需求调整自然语言任务描述,力求语义准确、上下文完整,以提升模型理解精度与执行效率。
TuriX-CUA 官方资源入口
TuriX-CUA 典型应用方向
- 办公文档自动化:一键生成 Word 报告、Excel 数据分析表、PowerPoint 演示文稿,并自动插入图表、导出 PDF 或邮件发送给指定联系人。
- 邮件全流程管理:根据规则自动生成邮件正文、添加附件、选择收件人并完成发送/回复,大幅降低重复性沟通成本。
- 结构化数据采集:从电商页面、财经网站、企业后台等多源渠道自动抓取价格、销量、股价、财报等关键字段并存入本地数据库或表格。
- 网页智能浏览与交互:在浏览器中自主完成搜索关键词、翻页筛选、点击目标链接、填写表单、点赞评论等用户常见行为。
- GUI 自动化测试:模拟真实用户操作路径,对桌面应用或 Electron 类软件开展界面功能验证、异常路径覆盖及回归测试。










