AWS允许智能体控制云端虚拟桌面,但每次点击可能消耗50万Token
亚马逊云服务AWS近日宣布将允许AI智能体接入其云端虚拟PC服务WorkSpaces。该服务目前处于预览阶段用户可通过亚马逊身份与访问管理IAM服务为智能体分配独立身份。智能体凭借相应凭证可通过唯一的预签名URL访问WorkSpace并操控云端PC上运行的任意应用程序。AWS发言人表示该公司建议开发者为每个智能体分配独立身份以便更清晰地追踪其行为并将智能体操作与人工操作加以区分。据悉智能体将通过托管的MCP端点进行连接该端点提供对桌面工具的受控访问包括截图、鼠标控制和文本输入等功能同时为开发者提供一个可控的交互界面并通过安全机制限定智能体的可执行操作范围。为智能体配备独立云端PC的主要目的是让其能够自动调用软件执行各类任务。云端或虚拟PC非常适合此类应用场景——它们可以按需创建与销毁仅在智能体完成任务期间保持运行。此外将智能体置于隔离的虚拟私有云中也比直接接入局域网或数据中心更为安全可控。对于那些完全依赖物理PC、或不希望让智能体操控本地虚拟机的企业来说云端PC也比自建本地虚拟化环境更为简便。AWS支持智能体访问WorkSpaces提供的多种实例类型配置从单核CPU、2GB内存的入门级小型实例到配备GPU、32核vCPU和256GB内存的高性能实例应有尽有。亚马逊提供两种租用模式一是按月收取固定费用、支持不间断使用二是收取较低月费并按小时计费。在云端PC智能体接入领域AWS并非唯一玩家——微软同样专为智能体推出了Windows 365专属版本。智能体操控PC依赖计算机视觉技术通常通过截图或录屏来获取桌面内容在读取画面后执行相应操作包括点击、输入和滚动等。AI编程工具公司Reflex认为这一过程所需的计算代价不可小觑。该公司近期发布研究报告称一个基于视觉的浏览器智能体仅完成一次下拉菜单点击操作就需要消耗约50万个Token使用智能体的成本可能是直接调用API的45倍。目前Reflex已将相关基准测试工具开源至GitHub供开发者自行验证其结论。Reflex增长负责人Palash Awasthi在公司博客中表示随着AI模型的持续进步成本有望逐步降低但他坚持认为与API相比智能体完成同一任务始终需要更多的操作步骤。因此在急于租用云端桌面之前或许值得先仔细权衡一番。QAQ1AWS的WorkSpaces智能体接入服务目前是否正式上线A该服务目前仍处于预览阶段尚未正式全面上线。用户可通过亚马逊身份与访问管理服务为智能体分配独立身份智能体凭借相应凭证通过唯一预签名URL访问WorkSpace并操控其中运行的应用程序。Q2为什么智能体控制虚拟桌面的成本这么高A根据AI编程工具公司Reflex发布的研究报告基于计算机视觉的智能体在操控桌面时每次操作都需要大量Token来处理截图或录屏内容。仅点击一次下拉菜单就可能消耗约50万个Token整体成本可能是直接调用API的45倍。即便未来AI模型性能提升、成本有所下降智能体完成任务所需的步骤仍会多于API调用。Q3AWS智能体云桌面服务和微软Windows 365有什么区别A两者均支持AI智能体接入云端虚拟桌面但各有侧重。AWS的WorkSpaces提供从入门级到高性能GPU实例的多种配置并支持按月固定收费或按小时计费两种模式适合不同规模的使用需求。微软则专门为智能体推出了Windows 365专属版本。目前两项服务在功能细节上的具体差异尚未完全公开披露。