据报道,11月2日Google高级副总裁Jeff Dean公布了Google AI在3个变革性领域取得的成果。
Google宣布了1000种语言计划,旨在建立一个支持1,000种最常用语言的AI模型,目前Google已经开发了一个通用语音模型(USM),它已针对400多种语言进行了训练,是迄今为止语言覆盖范围最大的语音模型。随着这项工作的扩展,在南亚Google正与更多的政府、非政府组织、学术机构展开合作,以收集更多具有代表性的音频样本。
Google将他们的扩散模型应用于视频序列,可以将一系列文本提示生成连贯的长视频,并首次展示了他们由AI生成的超分辨率视频。除了2D图像之外,现在也可以实现文本转3D,生成可以从任何角度查看的3D模型。Google的研究人员还在音频生成领域取得了重大进展,其AudioLM模型可以只通过听音频学习生成逼真的语音和钢琴音乐。
Google改进了对卫星图像的使用来训练AI模型从而实现实时识别和跟踪野火,帮助预测它们将如何演变和蔓延。目前Google已经在美国、加拿大、墨西哥和澳大利亚部分地区推出了野火跟踪系统,自今年7月以来,已经成功报道了美国和加拿大的30多起大型野火事件。
除了跟踪野火Google的AI还可以用来预测洪水,2021年他们通过Google搜索和地图向 2300万人发送了1.15亿条洪水警报通知,帮助挽救了无数生命。目前,Google正在将他们洪水预测系统的覆盖范围扩大到南美洲、撒哈拉以南非洲和南亚。
与此同时,Google正在研究AI如何帮助读取和分析低成本超声设备的输出,为资源匮乏地区的准父母提供孕期信息以尽早发现问题。同时他们还计划继续与护理人员和公共卫生机构合作,通过自动视网膜疾病评估工具 (ARDA) 扩大糖尿病视网膜病变筛查的范围。
此外,Google正在探索如何使用AI让用户通过手机就能检测呼吸和心率,让任何拥有智能手机的人都能更容易得获得医疗保健,也是 Google Health更广阔愿景的一部分。