从2014年Echo推出至今,亚马逊的Alexa在智能语音助手领域遥遥领先其他企业的相关产品。在很大程度上,这取决于它所拥有的数万项技能,而且,它的技能还在不断更新拓展。仅在本月中旬,Alexa的技能库里就新增了“测血压”、“解答护照和银行假期相关问题”的技能。
但据彭博社报道,在Alexa带来便利的同时,你的隐私正在被亚马逊收集并存储起来。
本月早些时候,据彭博社披露,亚马逊公司在全世界范围内雇佣了员工(评审员)来提升Alexa的服务功能,然而,这个巨大团队并不负责技术改进,而是负责收集用户对Alexa发出的指令,并作出相应的反馈。参与该项目的评审员从波士顿到哥斯达黎加,从印度到罗马尼亚,总之遍布全球。
据悉,评审员每天工作9个小时,要分析上千条录音。如此大规模、高强度地分析(监听),评审员难免会听到非常隐私的声音。有两名知情人甚至表示,他们确信自己通过Alexa听到了性侵事件,当他们向亚马逊公司寻求指导意见,却吃了闭门羹。
在彭博社爆料之后,亚马逊发言人发表了声明,大概是说:
亚马逊十分注重客户的隐私安全。我们收集用户对Alexa的指令,是为了更好地训练语言识别系统和自然语言处理系统,以便于改善用户体验。目前,亚马逊已有严格的技术和措施来保护用户的个人信息,即便是公司的员工也无权访问。
就在大家以为人工监听事件快要过去的时候,彭博社在本周三又放出了一颗炸弹:Alexa背后的评审员可以获知用户的家庭地址,甚至包括姓名和电话号码。如果用户选择与Alexa共享自己的联系人,这些联系人的相关信息也会出现在评审员的操作界面。
在彭博社看到的演示中,亚马逊团队成员将用户坐标(以纬度和经度形式存储在系统中)粘贴到Google地图中,不到一分钟,该员工便得到了用户房子的图像和相应的地址。
目前还不清楚有多少人可以访问该系统。Alexa团队的两名成员表示,他们相信Alexa数据服务部门的绝大多数员工到现在都能使用该软件。
虽然还没有迹象表明拥有数据访问权限的员工会去追踪用户的家庭住址,但两位成员还是表达了他们的担忧:亚马逊正在授予员工对客户数据不必要的访问权限,用以识别设备的所有者。
乔治城大学通信和技术所(Georgetown Law’s Communications and Technology Clinic)的律师和教学研究员Lindsey Barrett认为,位置信息比用户的其他私人信息更加敏感。
她说:“有人随时在收集你的位置信息,这意味着,即使是在不想被打扰的时候,你还是能被人找到。”
亚马逊广泛访问与Alexa有关的位置信息,像是为用户插上了红旗,使他们随时可见。
亚马逊会将挖掘用户数据设置为默认选项。
去年,用户首次向Echo询问有关位置的问题时,亚马逊已经能通过该设备所连接的网络来判断其大致位置。最近,该公司已开始把与用户账户关联的送货地址设为Echo的默认位置。
亚马逊的位置数据并不总是指Echo的位置。Alexa APP会在用户设置智能音箱时提示他们输入家庭住址,并且要求允许访问智能手机的位置信息。亚马逊表示它使用移动设备位置信息是为了给用户提供更相关、更优质的服务。
一名亚马逊员工称,亚马逊内部还有一款供更少人使用的软件工具,用来标记录音的转录本,协助Alexa对指令进行分类,并且存储更多的个人数据。
该员工称,在打开一个客户的ID号码后,那些分析和核实数据的工作人员可以在设置设备时,看到客户在Alexa应用程序中输入的家庭、工作地址以及电话号码。
如果用户选择与Alexa共享其联系人,则联系人的姓名、号码和电子邮件地址也会显示出来。这些数据都存储于系统中,因此如果用户说“向Laura发送消息”,人工审核人员可以确保核实人员正确地写了名称,以便软件学会将用户指令与联系人列表中的Laura配对。
对此,亚马逊给出的解释是:
亚马逊之所以收集位置数据,是为了更准确地为用户服务,比如建议当地的餐厅,或者提供天气预报。而且,评审员在入职之前都签订了保密协议,不会透露项目相关的任何内容。
亚马逊还表示:“公司严格控制对内部工具的访问,并且仅授予少数员工访问权限。这些员工需要用内部工具来处理极少量的交互样本,以培训和改进智能语音助手的服务。公司禁止员工出于其他任何原因访问、使用用户数据,对滥用系统的员工采取零容忍政策。我们也会定期审核、随时随地限制员工对内部工具的访问权限。”
一名员工表示,就在一年前,亚马逊的仪表板上详细显示了用户的联系人姓名、电话号码。现在,有些信息被遮挡了。
亚马逊在彭博社4月10日的报道后进一步限制了对数据的访问。数据服务部门的人发现他们不能再访问他们之前在工作中使用过的软件工具。
对于亚马逊的各种风波,该领域的专家Schaub并没有感到惊讶,他说道:
我们潜意识里认为语音助手在进行神奇的机器学习。但实际上,它们还无法脱离人类独立工作。
当然,亚马逊并不是唯一一家做类似事情的公司。去年,《卫报》报道了“伪人工智能”(pseudo-AI)的兴起,文中列举了一些人类顶替AI完成工作的科技公司,其中就包括Facebook、亚马逊、谷歌和苹果等科技巨头。
心理学家Alison Darcy在接受《卫报》采访时说道,
很多时候,AI的背后是人类而不是算法,因为建立一个良好的AI系统需要大量数据。但是,作为心理学家,我认为,这种欺骗行为显然违反了道德原则。
研究机构Canalys的数据显示,去年全球共销售7,800万个智能扬声器,其中,亚马逊的销售量大约占三分之一(图1)。Canalys预计,到2020年,智能扬声器的使用量会在2018年的1亿基础上再翻一番,达到2.25亿(图2)。
图1【 图片来源:Canalys Newsroom 所有者:Canalys 】
图2【 图片来源:Canalys Newsroom 所有者:Canalys 】
以上数据和图表似乎映射出了智能扬声器欣欣向荣的美好前景。
然而,就目前而言,凭空创造出一个能够准确识别语音或人脸的神经网络几乎不可能的。因为仅凭算法,语音助手无法准确识别不同的口音、俚语、或者是其他一些带有挑战性的任务。
随着Echo的走红,Alexa无疑成为了亚马逊所推出的最具影响力的产品之一。
虽然人类参与训练语音助手是为了进一步提升语音助手的服务,但亚马逊不仅对用户与Alexa对话的监听,还是能轻易找到用户的家庭住址,可见智能设备背后的科技巨头可以轻易获取用户隐私,不禁让人为个人隐私的安全问题所担忧。
回想起百度李彦宏曾说过:“中国用户愿用隐私换方便和效率”,但事实真的如此吗?
其实消费者都虽然乐意享受科技带来便利,但同样更在意其隐私有没有得到尊重。身为大公司的亚马逊应该深知保护用户隐私的重要性,但是,至少从眼下看来,它做的还不够好。
(综合整理自环球网、雷锋网、智东西)