project
Project Mariner - 谷歌推出的浏览网站智能体,能帮用户操作表格、在线购物
Project Mariner 是谷歌 DeepMind 推出的浏览器助手。Project Mariner基于 Gemini 2.0 技术,用 Chrome 扩展程序实现浏览器自动化,理解和执行网页任务。Proj...
Project Mariner是什么
Project Mariner 是谷歌 DeepMind 推出的浏览器助手。Project Mariner基于 Gemini 2.0 技术,用 Chrome 扩展程序实现浏览器自动化,理解和执行网页任务。Project Mariner能理解和推理浏览器屏幕上的信息,包括像素和网页元素,基于 Chrome 扩展程序使用这些信息完成任务。Project Mariner 能控制 Chrome 浏览器、移动屏幕上的光标、点击按钮和填写表格,像人类一样使用和浏览网站。Project Mariner在 WebVoyager 基准测试中达到 83.5% 的高分成绩。目前,Project Mariner 只能在浏览器的活动选项卡中执行键入、滚动和点击操作,在执行某些敏感操作(如购买物品)之前,会要求用户进行最终确认。
Project Mariner的主要功能
- 多模态理解:理解浏览器屏幕上的所有内容,包括像素、文本、代码、图像和表单等数据。
- 浏览器交互:实时导航和操作复杂的网站,自动执行浏览器中的任务,保持用户的控制权。
- 自动化任务:自动与浏览器进行交互操作,将数据整理、填充到网页其他区域,同时将数据按照用户的要求整理好。
- 复杂指令处理:理解、执行复杂的用户指令,分解为可执行的步骤。
- 关系理解:理解不同网页元素之间的关系及其功能。
- 视觉反馈:在执行任务时提供视觉反馈和更新,让用户了解进度。
- 安全性:在执行敏感操作(如购物和付款)之前,会要求用户进行最终确认,确保安全性。
如何使用Project Mariner
Project Mariner目前处于早期测试阶段,仅对少数测试者开放,访问Project Mariner的官方网站,加入等候名单。
Project Mariner的应用场景
- 数据整理与复制:将网页上的数据复制到电子表格中进行整理,例如从存储大量数据的网页提取信息,整理到Excel等表格软件中。
- 在线购物:根据用户给出的购物清单,自动在电子商务网站上搜索商品添加到购物车。
- 旅行规划:帮助用户查找航班和酒店信息,自动化旅行规划过程中的网页浏览和信息比较。
- 日常购物:为用户在零售网站上购物,如搜索、购买家庭用品。
- 食谱查找:在食谱网站上根据用户需求自动搜索和选择食谱。