在我以前撰写的有关这个主题的文章中,我们讨论了不同类型现实的具体含义(参见《全新的虚拟现实、增强现实、混合现实、超现实和减少现实世界》(A brave new world of virtual, augmented, hybrid, hyper, and diminished realities))。
2016年9月21~22日,在美国明尼阿波里斯市举行的嵌入式系统会议(ESC)上,曾经帮助开发Myst和26个其它视频游戏的插画家兼动画师Chuck Carter在他的主题演讲“把玩新的游戏:虚拟现实的挑战和机会”中讨论了虚拟现实的挑战。
正如我们在前述文章中讨论的那样,增强现实其实只是介导现实的一个子集,因为介导现实还包含了减少现实或删除现实(Diminished Reality或Deletive Reality)。在本文中,我们将把注意力转向各种呈现技术和潜在应用。
这方面我关心最多的是介导(增强和/或减少)现实能够呈现给用户的方式。一种方式是通过智能手机或平板电脑的“视窗”观察世界。Youtube上的视频“您的手机可以快速翻译标志吗?”是一个很好的例子,它展示了标志的实时翻译。
另外一个例子是我在iPad里安装的GoSkyWatch应用。当你拿着平板电脑朝向夜晚的天窗时,你会在屏幕上看到与真实天空中相同的各个星星和天体,只是屏幕上的星球标上了星座的名称和轮廓等内容(图1)。当你轻击其中某个星球时,这个app会引导你前往这个星球在苍穹中的当前位置。(备注:我不是十分肯定如何分类这个应用—它不完全是增强现实,也不是真正的虚拟现实—我很想听听你对这个问题的想法。)
图1:GoSkyWatch应用。
如果偶尔拿起iPad观看像夜空这样的对象,我觉得是没问题的,但我可不希望整天拿着智能手机或平板电脑并通过它的屏幕来观察世界。
谷歌眼镜给人较少的突兀感,在某种程度上很有用,但最终也会走Dodo的老路(说到这儿,谷歌眼镜似乎确实在紧急医疗领域找到了第二生命)。实际上我自己从未尝试过这个东西,但我认为它不会给我提供我想要的沉浸式体验。
在未来的某一天,人们的眼睛或身体的其它部位会嵌入虚拟/介导现实系统。在这之前,我能想象到的就是通过隐形眼镜把虚拟现实和介导现实直接投影到隐形眼镜佩戴者的视网膜上(我不知道如何解决供电问题)。
在我有生之年,我能想象这样的情景:人们佩戴着类似眼镜的谷歌产品,该产品将文字、图像和视频数据叠加在现实场景之上。就我所知,这个领域中的领头羊是一家名为Magic Leap的公司。看看Magic Leap主页上的图2这个视频,可以让你体会一下什么叫可能。
图2:Magic Leap主页视频截图。
但是,不远的将来会是什么样的呢?我能很容易地想到这样的世界:到处是戴着Oculus Rift类型头盔的人们。这些头盔通过提供双眼视觉的两个前视摄像头得到增强。默认状态是这两个摄像头的图像投映到佩戴者眼前的显示画面上,从而提供与用户根本没戴头盔完全一样的视觉感受。额外的信息则可以分层叠加到现场世界场景之上。
图3:虚拟现实头盔体验(体验者身份未知)。
此时此刻你可能会想“Max已经失去理智了;像这样穿戴的人出现在公共场合简直就是不可思议的事情。”关于这一点我想用以下一些小片段来回应:
· 朋客摇滚是20世纪70年代中期登上舞台的。我记得就在那段时间曾拜访过伦敦的好友。在我停留在伦敦的某一天,我发现自己坐在一列地铁列车上,对面是一位穿西装戴领带的商人,他还带着一个公文包和一把伞。坐在这位商人一边的是一位全副武装的军人;另一边是朋克摇滚乐人,穿着一套有趣的服装,戴着皮带和项链,理着半边剃了光头并扎着粉色马希坎式发型的头(我本身现在很崇尚“反马希坎式”发型—想到这个就感觉以前的世界真有趣)。关键是我看过这种场景,因此再看到时不会感到太吃惊。
· 我的岳母刚好赶上了这波技术潮流。她是Star Trek类型蓝牙耳机的早期接受者之一。她也习惯于把她的手机设为自动应答模式。有次她来看我,我带她到当地的超市去选购东西。由于她头发很长,我不知道她佩戴着耳机。正当我们在到处浏览商品时,她突然开始对着看不见的人大声讲起话来,而且手舞足蹈的样子。老实说我以为她疯了。有两件事闪过我的脑海:(a)我将如何带她离开商店?(b)当我们回到家时,我的妻子(美丽的吉娜)肯定会说“天呀,你只是和我妈出去了30分钟,你就让她疯掉了!”当然,现在当你看到很多女士在超市里猛烈地挥舞着手臂并自说自话时不会感到太惊讶。(有时我会想有多少人真的在用手机?)
· 回到很早以前我从大学毕业的那个夏天,就在我开始第一份工作之前,我和几位朋友去希腊的一个小岛过了几周。当时我们游玩了一个海滩……假如说这里不鼓励穿衣服,你可能觉得这会让人感觉不安,但奇怪的是,如果你眼睛所能看到的每个人都是裸体,反而是穿了衣服的那个人会更尴尬。
我啰嗦半天的要点是,如果你看到只有一个人戴着Oculus Rift式的头盔在公共场所到处走动,你会认为“很奇怪”,或“他看上去像个傻子(但他穿的花衬衫很
好看)”。另一方面,如果你周边一半的人都戴着这样的头盔,那么用不了多久你就根本注意不到他们的存在了。
老实说,我认为任何人都不清楚虚拟现实和介导现实技术会把我们带往哪里,不过我有一些想法和主意想跟大家分享。游戏是虚拟现实的一个明显应用。以前我从未认为自己是一个游戏玩家,但我必须承认我很喜欢戴上我的Oculus Rift玩游戏(参见“It's (Virtual Reality) Life Jim, But Not As We Know It”和“Minecraft + Oculus Rift Virtual Reality = Mind Goes Boom”)。不过让我们跳出这个思维局限吧……
另外一个明显的应用是教育。就拿意大利罗马的竞技场(也称为Flavian圆形竞技场)为例。当我还是小孩子的时候,为了能看上书本中的黑白照片,我们需要赤脚在雪地里走3英里上坡路(哦,我多么想念英国的夏日时光呀)。在后来的几年中,学校经常会放映8mm的教育胶片。随着时间的推移,这些内容逐渐被视频替代。直到最近,老师开始播放DVD或来自某些教育资源的在线流视频。在不远的将来,我可以想象老师和学生都戴着虚拟现实头盔,开始有指引的游览,所有参与者都可以看到彼此的替身。可以到处浏览,全神贯注于感兴趣的地方,对着身边(虚拟)的朋友细声说话,甚至离群走散和迷路(“Max这个年轻小伙到哪儿去了?”),都会极大地增加体验感受。
假设我们中的某人是全球分布着很多办公室和数据中心的大公司的IT管理人员。再假设有人开始抱怨缓慢的响应时间。我不知道今天的IT人员是如何追踪并解决这类问题的……也许我看了太多的科幻片……但我可以想象我们的IT专家戴上她的虚拟现实头盔,使用手势将她自己传送到信息装置上方开始虚拟的鸟瞰,从那里她可以观察到进出大楼的虚拟网络高速通道(想想TRON)。也许这些高速通道的大多数是健康的绿色,其中有一条是愤怒的红色。因此我们沿着红色通道“飞越”各国向上到达一颗卫星,跨越大洋到另一颗卫星,向下到达地面接收机,并横穿大陆到达另一座大楼。现在我们飞进大楼,进入服务器房间,发现有个服务器机箱状态不对。随即我们跳入这个服务器机箱,发现有块硬盘发生故障,因此拿一块好的硬盘换上去,所有这一切都静静地发生在我们的虚拟世界中。同样,我知道这听起来像是未来电影的剧本,但我真的能够感觉到类似场景扑面而来。
与上述场景一样,假设你坐在一座像炼油厂这样的大工厂的控制室内,这个大工厂占地好几平方英里,有数百英里的走线和管道,成千上万的开关、阀门、传感器和执行器。现在假设听到一种告警声,指示某个东西出了故障。同样,我能想象穿戴了虚拟现实头盔的操作人员在工厂里走来走去,瞄准故障装置的视觉指示,观看来自实际传感器的虚拟代表的值,并激活控制器和阀门的虚拟代表—所有这些动作都能在物理世界中自动复现。
你觉得怎么样?我是坐着快速火车去往幻境吗?或者你觉得所有这一切是一种(很小或很大的)概率?另外,虽然我们在这里讨论了一些,但你还能想到虚拟现实技术的任何其它商业和/或工业应用吗?
出于本文的目的,我仍然试图让自己回到删除现实概念上来,因此让我们把重点放到它们的对立面—增强现实上来吧。
就像许多人认为虚拟现实的目标应用是游戏,进而惊奇地发现还有许多更专业的应用一样,许多人认为增强现实的目标是现实世界目的,因此惊讶地发现这种技术还能应用于游戏和教育领域。举个例子,远的不说,就拿Pokémon Go来说,它在2016年7月不知从哪儿就冒了出来,仅仅几周后,每天北美地区的用户数就超出了2,000万。
为了在理解这个专栏剩余内容的同时给我们思考的素材,请欣赏展示芝麻街增强现实玩偶的这段视频和展示一些非常有趣的增强现实实现的这段视频。
回到严肃的增强实现应用,你能想象一架快要降落机场的小型飞机飞行员穿戴着增强现实头盔,看到一连串发光的矩形框叠加在真实场景上面,这些矩形框漂浮在空中并退向远方的情景吗?(在首部外星人电影中就有类似的场景)。飞行员所要做的就是驾驶飞机飞过每个矩形框的中心,欣赏最有燃油效率的着陆路径。
与上述类似,航行在密西西比河的游艇船长可以使用他的增强现实头盔浏览叠加在河道上的沿途虚拟港口和右舷浮标,同时还能看到有根虚线指示船只行驶的最佳航线。
当你开车到一个陌生的地方会怎么办?今天的GPS系统着实令人惊讶,它们可以通过语音告诉你怎么走。这点是不错,但你偶尔还是必须要把注意力从道路上移开去检查屏幕内容。如果能在你前方场景上叠加一个带箭头的虚线指示要在哪里拐弯是不是很酷?如果你自己徘徊在一个陌生的城市,这个方案同样适用—能够定义一个比如当地博物馆的目的地,然后用一个带箭头的虚线引导你到达这个目的地将是难以置信的方便。
虽然我不认识你,但我在记住人名和识别人脸方面真的很不在行。当在某次会议上,有人认为因为几年前曾跟你见过面,你会认出他们却认不得时,真的会非常尴尬。如果能够看到在每个人头上悬浮着一些小的“信息气泡”,气泡中详细记载着他们的名字、公司和职位,并且有颜色指示你以前是否见过等等,那将是一件多么赏心悦目的事情啊。
还是回到与人交流的主题上来,有时很难“读懂”某个人的心情—是喜是忧,是困惑还是气愤?如果将这类信息通过增强现实系统呈现出来不是很有用吗?(我可以想象我跨进家门,看到我的妻子说了声“你好,亲爱的”——当她转过身面对我时——我的增强现实系统闪烁着这样的消息“危险,Robinson,快跑,跑得越远越好!”)
同样,当某人对你撒谎时你能看得出来吗?(你看过《可以识别电子邮件和约会网站中谎言的算法(Algorithm can spot lies in emails and dating sites)》那篇文章吗?)假设你正在与一个二手车销售人员聊天,他正在极力赞美其中的一辆车,而你的增强现实系统可以在他每次说到要点时实时显示绿钩(“实话”)或红叉(“假话”)。(注意,这种系统不必理解说的话——它可以观察和分析销售员的非语言线索。)
我还可以在这个话题上讲很长时间。不过我能邀请你先看段视频吗?这段视频展示了一种极端形式的增强现实——超现实(这段视频值得从头到尾看完)。
所有这些看起来有点疯狂,但我真的相信它所呈现出来的各种可能性很快就能变成现实。
整个虚拟现实和增强现实场景真的让我脑洞大开。比如在虚拟现实情况下,你能想象在虚拟大楼中发生下一代版本的《妙探寻凶》(Cluedo)(“他就是图书馆中带着铅水管的黄上校!”)?在扮演侦查员时,你可以在大楼周围行走并利用物体(比如查看挂钟下方或照片背后)寻找线索。
进一步想象系统中增加了语音识别和生成功能,因此允许你采访角色,问他们问题,并尝试检测他们回答中存在的任何谎言或遗漏。如果你见证了Oculus Rift带来的可能性,你就不会认为所有这一切还太遥远。
在增强现实情况中,我认为也用不了多久(相对而言)这些系统中就会增加基于深度神经网络(DDN)的嵌入式视觉系统,用来执行实时目标检测、识别和分类任务,并将结果呈现在场景之上。我还能想象到每个人的增强现实系统通过网络连接到一起,允许每个人在出现紧急情况时作出正确的响应。
在结束讨论前,我想重申的是,我真的想象不出在不远的将来,虚拟现实和介导现实技术会把我们带到何处。我们几乎每天都能看到新的消息发布,比如将人的手臂变成虚拟键盘,使用智能眼镜以新的方式看世界,或者谷歌最近决定收购一家图像识别初创企业Moodstocks。
从我个人来讲,我都等不及想看到所有这些成为现实。你呢?你是带着恐惧还是高兴的心情迎接虚拟未来和介导未来?什么样的虚拟应用和/或介导应用你最乐于见到?是什么(如果有的话)会让你对这些感到恐惧?