AI自主操控电脑!谷歌版「贾维斯」年底出世

日期:

可帮助收集研究、购买产品或预订航班

科幻中的贾维斯,已经离我们不远了。

据The Information报道,Alphabet旗下的Google正在开发一项突破性的人工智能技术,这项技术能够接管一个人的网络浏览器来完成任务,例如收集研究、购买产品或预订航班。

这项代号为“Project Jarvis”的产品预计将在12月份随着新一代旗舰大语言模型Gemini的发布一同亮相。

报道称,“Jarvis”将由未来版本的谷歌 Gemini 驱动,专门针对 Chrome 浏览器进行优化。

该工具旨在通过截取屏幕截图、解析内容并自动点击按钮或输入文本,帮助用户“自动化日常的网页任务”

 不过,知情人士还提示道,“Jarvis”的计划是暂定的,也可能会有所变动。

目前Jarvis还存在一些问题:

速度慢:据说每个动作前它都要思考几秒钟,这可能会让用户感到不耐烦。
安全隐患:要完成任务,AI需要访问用户的登录密码和信用卡信息,这无疑会引发安全担忧。
可能出错:大语言模型有时会产生错误答案,如果让它直接操作电脑,后果可能会很严重。

所以,谷歌可能会先让一小部分人试用,以帮助识别和修复其不足之处。

值得注意的是,目前所有大型 AI 公司都在研发类似功能的模型。

微软支持的OpenAI此前也在开发类似技术,计划通过”计算机使用代理”(CUA)来实现AI自主浏览网页并基于发现采取行动。

苹果的 Apple Intelligence 预计将在明年具备跨多个应用程序的屏幕识别能力。

Anthropic 刚刚推出的 Claude 测试版已能在计算机上执行操作,将AI代理概念推向更深的层次。

尽管谷歌是很多AI技术的发明者,但在商业化方面却总是慢人一步。

OpenAI的ChatGPT早已风靡全球,而谷歌的Gemini聊天机器人却还在后面追赶。为了不再落后,谷歌甚至把Gemini团队并入了DeepMind,希望能提高AI开发效率。

值得一提的是,谷歌CEO桑达尔·皮查伊在今年春季的开发者大会上就曾暗示,未来版本的Gemini可能会自动执行多个操作,比如帮用户退货。看来,「贾维斯」就是这个想法的具体实现。

[ad_1]


[ad_2]

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Share post:

订阅

spot_imgspot_img

流行

相关文章
Related