新闻 发表于 2025-4-19 17:51

谷歌AI眼镜全球首秀,多模态AI助手,带显示,3D导航、实时翻译、记忆功能......

作者:微信文章


AI眼镜

创业者

语音秒翻字幕、记住你丢的房卡!谷歌AI眼镜全球首秀,黑框配色。实时翻译+记忆功能+Gemini AI能引爆AI眼镜革命嘛?
谷歌在TED大会展示新型AI眼镜
Android XR部门负责人Shahram Izadi和一位同事展示了这款外观类似普通眼镜的AI设备,现场演示了从波斯语到英语的实时翻译、书籍扫描等多项功能。

"这些眼镜与您的手机协同工作,通过双向数据流传输,使眼镜保持轻便的同时能够访问所有手机应用程序,"Izadi表示。



在TED演讲中,谷歌增强现实和扩展现实部门负责人Shahram Izadi表示,这款设备是他几乎整个职业生涯致力于增强现实领域的成果。

"增强现实和虚拟现实已将计算从矩形屏幕发展到360度沉浸式显示,如今甚至让世界本身成为显示界面,"Izadi对现场观众说。"我们现在将这一广泛的体验集合称为扩展现实,即XR。"

Izadi和他的团队利用AI和XR技术创建了Android XR操作系统,该系统可以通过较重的头戴式设备或"外观普通的眼镜"来使用。



Izadi邀请他的同事Nishtha上台展示这台智能眼镜。

首先,她让谷歌的AI助手Gemini为面前的TED观众写了一首诗。

但Izadi承认,AI实时看、听和回应的功能还比较基础。因此他决定"更进一步",展示了一个名为Memory(记忆)的工具。

"在滚动的上下文窗口中,AI会记住你所看到的内容,无需告诉它要跟踪什么,"Izadi说。

"我一直找不到我的酒店钥匙卡,"Nishtha对Gemini说。"你知道我最后把卡放在哪里了吗?"

"酒店钥匙卡在音乐唱片的左边,"Gemini回答,指的是她身后架子上的物品。

"对于像我这样健忘的人来说,这真是一个杀手级应用,"Izadi开玩笑道。

最令人印象深刻的或许是该设备能够实时检测、翻译并转录语言,以弹出字幕的形式呈现。

网友:演讲词藏在眼镜里,这么一说我就懂了!

"你们可能之前见过类似的翻译演示,但现在的新特点是,除了能用不同语言说话外,我也可以用不同语言与Gemini交谈,"Nishtha说,她用印地语与Gemini交流并实时获得回应。



接下来,Izadi请出他的同事Max,在三星的Project Moohan XR头显上测试相同的操作系统。

使用这款"更具沉浸感"的头戴设备,谷歌团队从鸟瞰视角探索了南非开普敦,在查看详细地图时,Gemini提供了关于当地城镇的见解。

然后他们切换到一段滑雪视频,要求Gemini通过背景中山脉的轮廓来估计斜坡的位置。

最后,他们切换到《星露谷物语》游戏,Gemini为玩这款游戏提供建议。

在完整的TED演讲中(可能会在来年在线发布),Izadi和他的同事展示了系统在虚拟现实和现实之间无缝切换的能力,这些演示看起来就像直接从超级英雄电影中走出来一样。

记者Victoria Song在12月有机会体验该平台的早期版本时也表达了类似感受。

"在一个受控的演示中,我感觉自己最接近钢铁侠,"Song在The Verge上写道,并表示Gemini感觉就像她的"贾维斯"。

"我尝试过数十款头显和智能眼镜,它们承诺能实现我在电影中看到的场景——但都彻底失败了,"她继续写道。

"这是我第一次体验到相对接近的东西。"

Izadi透露,这只是Android XR功能的一小部分,其他功能还包括在"虚拟大屏幕"上观看电影、通过Google Photos以3D方式重温记忆、使用"Circle to Search"(圈选搜索)获取你面前物体的信息等。

"搭载Android XR的眼镜将让Gemini的强大功能触手可及,在您需要时提供有用信息——如导航指引、翻译或消息摘要,无需拿出手机。所有信息都在你的视线范围内,或直接通过耳机传递"。

参考:

https://www.goodgoodgood.co/articles/google-glasses-android-xr-translation

—— End ——



AI创业者

社区拓展:

【经验+踩坑】做VR大空间,月活跃用户15万,总营收2亿美金,如何做到的?最新笔记思考

面向AI智能眼镜的创业者手册:风向标、AI代理+眼镜方案、demo、行业趋势、大厂战略......

社区成员扫码查看



近期【驶向互联网下一站】社区VIP内容,AI商业化、XR创业、以及一人公司模式的多个方面,为相关领域的从业者提供内容、信息和数据支持!

页: [1]
查看完整版本: 谷歌AI眼镜全球首秀,多模态AI助手,带显示,3D导航、实时翻译、记忆功能......