谷歌AI眼镜全球首秀,多模态AI助手,带显示,3D导航、实时翻译、记忆功能......
作者:微信文章AI眼镜
创业者
语音秒翻字幕、记住你丢的房卡!谷歌AI眼镜全球首秀,黑框配色。实时翻译+记忆功能+Gemini AI能引爆AI眼镜革命嘛?
谷歌在TED大会展示新型AI眼镜
Android XR部门负责人Shahram Izadi和一位同事展示了这款外观类似普通眼镜的AI设备,现场演示了从波斯语到英语的实时翻译、书籍扫描等多项功能。
"这些眼镜与您的手机协同工作,通过双向数据流传输,使眼镜保持轻便的同时能够访问所有手机应用程序,"Izadi表示。
在TED演讲中,谷歌增强现实和扩展现实部门负责人Shahram Izadi表示,这款设备是他几乎整个职业生涯致力于增强现实领域的成果。
"增强现实和虚拟现实已将计算从矩形屏幕发展到360度沉浸式显示,如今甚至让世界本身成为显示界面,"Izadi对现场观众说。"我们现在将这一广泛的体验集合称为扩展现实,即XR。"
Izadi和他的团队利用AI和XR技术创建了Android XR操作系统,该系统可以通过较重的头戴式设备或"外观普通的眼镜"来使用。
Izadi邀请他的同事Nishtha上台展示这台智能眼镜。
首先,她让谷歌的AI助手Gemini为面前的TED观众写了一首诗。
但Izadi承认,AI实时看、听和回应的功能还比较基础。因此他决定"更进一步",展示了一个名为Memory(记忆)的工具。
"在滚动的上下文窗口中,AI会记住你所看到的内容,无需告诉它要跟踪什么,"Izadi说。
"我一直找不到我的酒店钥匙卡,"Nishtha对Gemini说。"你知道我最后把卡放在哪里了吗?"
"酒店钥匙卡在音乐唱片的左边,"Gemini回答,指的是她身后架子上的物品。
"对于像我这样健忘的人来说,这真是一个杀手级应用,"Izadi开玩笑道。
最令人印象深刻的或许是该设备能够实时检测、翻译并转录语言,以弹出字幕的形式呈现。
网友:演讲词藏在眼镜里,这么一说我就懂了!
"你们可能之前见过类似的翻译演示,但现在的新特点是,除了能用不同语言说话外,我也可以用不同语言与Gemini交谈,"Nishtha说,她用印地语与Gemini交流并实时获得回应。
接下来,Izadi请出他的同事Max,在三星的Project Moohan XR头显上测试相同的操作系统。
使用这款"更具沉浸感"的头戴设备,谷歌团队从鸟瞰视角探索了南非开普敦,在查看详细地图时,Gemini提供了关于当地城镇的见解。
然后他们切换到一段滑雪视频,要求Gemini通过背景中山脉的轮廓来估计斜坡的位置。
最后,他们切换到《星露谷物语》游戏,Gemini为玩这款游戏提供建议。
在完整的TED演讲中(可能会在来年在线发布),Izadi和他的同事展示了系统在虚拟现实和现实之间无缝切换的能力,这些演示看起来就像直接从超级英雄电影中走出来一样。
记者Victoria Song在12月有机会体验该平台的早期版本时也表达了类似感受。
"在一个受控的演示中,我感觉自己最接近钢铁侠,"Song在The Verge上写道,并表示Gemini感觉就像她的"贾维斯"。
"我尝试过数十款头显和智能眼镜,它们承诺能实现我在电影中看到的场景——但都彻底失败了,"她继续写道。
"这是我第一次体验到相对接近的东西。"
Izadi透露,这只是Android XR功能的一小部分,其他功能还包括在"虚拟大屏幕"上观看电影、通过Google Photos以3D方式重温记忆、使用"Circle to Search"(圈选搜索)获取你面前物体的信息等。
"搭载Android XR的眼镜将让Gemini的强大功能触手可及,在您需要时提供有用信息——如导航指引、翻译或消息摘要,无需拿出手机。所有信息都在你的视线范围内,或直接通过耳机传递"。
参考:
https://www.goodgoodgood.co/articles/google-glasses-android-xr-translation
—— End ——
AI创业者
社区拓展:
【经验+踩坑】做VR大空间,月活跃用户15万,总营收2亿美金,如何做到的?最新笔记思考
面向AI智能眼镜的创业者手册:风向标、AI代理+眼镜方案、demo、行业趋势、大厂战略......
社区成员扫码查看
近期【驶向互联网下一站】社区VIP内容,AI商业化、XR创业、以及一人公司模式的多个方面,为相关领域的从业者提供内容、信息和数据支持!
页:
[1]