用AI实现更好的AR,谷歌多项视觉应用升级

OpenAI 的聊天机器人 ChatGPT 和 Stability AI 的图像生成器 Stable Diffusion 等人工智能工具的出色表现,使得人们 AI 应用充满期待。在近期于巴黎举行的 Google Live 活动中,谷歌公布了几项新的人工智能功能,这些功能将对 AR 带来增强和扩展。

谷歌镜头:你的相机就是你的键盘

谷歌高级副总裁 Prabhakar Raghavan 指出,谷歌镜头的使用量呈爆炸式增长,目前每月有超过 10 亿次的视觉搜索。因此,谷歌一直在努力改进这种结合 AI 和 AR 的技术。

翻译是谷歌镜头最有用的功能之一,在得到增强后将使 AR 叠加更具吸引力。以前,AR 翻译出现在被屏蔽的背景上,隐藏了外语文本。新版本的谷歌镜头使用与背景无缝融合的 AI 生成的图形重新创建丢失的像素,结果是一张照片,包含用你的母语书写的内容。

镜头最近获得了一项名为“多重搜索”的升级,允许你通过添加关键字来优化镜头结果。其中“我附近”搜索会找到你当前位置附近的类似产品。该功能首先在美国推出,但会在未来几个月内推广到更多国家。

沉浸式视图使谷歌地图变得身临其境

谷歌的沉浸式视图能在谷歌地图中将选定的城市地标渲染成细节丰富的 3D 模型——这要归功于对数十亿张航拍照片和 360 度街景图像的 AI 分析。生成的图形几乎是逼真的,并允许你通过这些数字现实再现,在物体周围和城市之间进行虚拟飞行。

这项谷歌地图技术于 2022 年首次发布,其中包括 250 个地标的 360 度视图。沉浸式视图将很快扩展到更多城市,包括洛杉矶、旧金山、纽约、伦敦、东京、阿姆斯特丹、都柏林、佛罗伦萨和威尼斯。

谷歌地图的一项相关功能“室内实时视图”(Indoor Live View)使用 NeRF 技术,让你可以通过手机访问选定的餐厅和其他企业,其工作方式与街景一样。

谷歌正在大幅增加具有室内 AR 导航和沉浸式视图功能的地点数量。近期增加了 1000 个新机场、火车站和购物中心,重点仍然在主要大都市地区,地点包括纽约、伦敦、墨尔本、悉尼、柏林、法兰克福、布拉格、巴黎、东京、台北、新加坡、马德里、巴塞罗那和圣保罗等。

实时取景简化旅行

谷歌的实时视图是谷歌地图中一项现有的功能,它使用手机的摄像头显示地点的位置,在实时 AR 视图中叠加视觉标签。这在穿越不熟悉的地区时非常有用。实时取景现已在洛杉矶、旧金山、纽约、伦敦、巴黎和东京推出,在巴塞罗那、都柏林和马德里也很快能使用。

在实时取景可用的地方,你可以点按谷歌地图搜索栏中的摄像头图标以启用。你可以点击 AR 视图中显示的任何图钉以了解有关该位置的更多信息。

实时取景可使你方便地获得关于餐厅的评论,在机场周围找到自己的路。该功能在手机取景器中叠加箭头,因此你在复杂的机场或火车站导航时不会迷路。

谷歌艺术与文化更具吸引力

谷歌艺术和文化应用所包括的 AR 功能使看似枯燥的话题更具吸引力。艺术自拍是谷歌移动设备上的第一个 AI 应用程序。它可以让你自拍或拍摄宠物照片,然后在经典艺术作品中找到相似的人和动物。

新近增加的 Woolaroo 可让你使用手机的摄像头识别物体。Woolaroo Web 应用程序以所选语言覆盖已识别对象的单词,这能使你以一种身临其境的方式来增加你的外语词汇量。Woolaroo 支持 17 种语言。

谷歌的艺术和文化应用可以通过其 AR 功能将著名的艺术品以及考古和科学物品带入你的家中。元素周期表功能可让你通过手机以充满房间的比例查看原子。谷歌即将推出更多语言版本的此学习工具,包括德语、法语和西班牙语等。

人们对 AR 模型的兴趣正在迅速增加。谷歌报告称,最近谷歌艺术与文化的 AR 功能的使用量增加了八倍。

谷歌在活动结束时强调,随着更多的视觉搜索选项变得可用,人们不再需要手动键入文本搜索。这显然为谷歌未来推出 AR 头显或 AR 眼镜奠定了基础。与三星和高通合作开发的 XR 头显将能够更好地将这些视觉信息和搜索融入日常生活,这比智能手机屏幕要好得多。【编译自 The-Decoder】

有问题和想法?与数字诗人讨论、交流,以获得更多的信息、意见。

赞赏
毕昂
毕昂
稍后
本文系数字叙事原创(编译)内容,未经授权,不得用于商业目的,非商业转载须注明来源并加回链。

订阅

受欢迎的

相关文章
Related