个性化的机器学习
麻省理工学院的研究小组意识到, 具有深度学习能力的治疗机器人能够更好感知儿童的行为的。深度学习系统使用分层的多层数据处理来处理其任务,每一个连续的层都是对原始数据抽象的表示。
尽管自 20 世纪 80 年代以来深度学习的概念已经出现,但直到最近才有足够的计算能力来实现这种人工智能。深度学习已被用于自动语音和对象识别程序中, 这种应用非常适合解决面部、 身体和声音等多重特征的问题,从而更好地理解抽象的概念,如儿童的参与感。
对于治疗机器人,研究者构建了一个个性化框架,可以从收集的每个孩子的数据中学习。研究人员拍摄了每个孩子的脸部表情、 头部和身体动作、 姿势和手势, 记录了儿童手腕上显示器的心率、 体温和皮肤汗液反应作为数据。这些机器人的个性化深度学习网络是根据这些视频、音频和生理数据的层次, 针对孩子的自闭症诊断和能力、 文化和性别的信息构建的。研究人员将机器人对儿童行为的估计与五位人类专家的估计数字进行了比较,这些专家连续对孩子的录像和录音进行编码,以确定孩子在会议期间高兴或不安程度,是否感兴趣以及孩子的表现。比较发现,机器人对儿童行为的估计要比专家更加具体清晰。
网络调查法、 统计规则法和文本内容挖掘是三种经常被使用的网络舆情分析方法。大数据时代的来临使传统的舆情分析方式发生改变,大数据时代数据量突增、 数据产生的速度极快、冗余信息占比高的特性不仅给舆情分析带来新的发展机遇, 也带来了新的难度和挑战。基于简单调查和统计的舆情分析方法将无法适用于大数据环境下的网络社区文本。当前国内外对舆情分析技术的研究也大多以大数据环境为背景,与传统舆情分析技术相比,大数据时代网络社区的舆情分析技术更多地集中于对数据的获取, 并采取文本数据分析、数据挖掘、语义分析等技术获取舆情信息。 当前国内外的舆情分析技术研究主要集中于话题识别与话题跟踪、意见领袖识别以及情感倾向判别这三个方面。
话题识别与话题跟踪首先在文本中识别出新话题, 接下来在一段时间内检测并实时跟踪话题,实现该话题的再现,研究其随时间发展的演化过程。聚类方法常用于进行话题识别。在国外研究中,话题检测与跟踪(TDT)是了解社交媒体热点话题及其演变过程的重要手段。
意见领袖的发现和识别重点在于评价指标的制定以及模型的构建。例如,曹玖新等将网络社区用户看作一个个节点,根据节点之间信息的交互和传播过滤, 从用户结构、行为和情感三个特征维度挖掘意见领袖。
情感倾向判别在舆情研究中最为常见,首先收集 web 金融领域的文本数据属性, 接下来构建金融领域的情感词典, 最后结合语义分析,将语义规则应用到情感及情感强度识别当中,提升了分类器的准确率 M。王永等人将倾向分析应用到客户评论信息挖掘当中,结合情感词之间的依存关系计算面向产品特征的情感倾向得分,从网络评论中获取有价值的商业信息。国外针对 Twitter 的情感倾向分析研究居多,用以获取有价值的信息和舆论导向,例如,结合语言规则特征可以分别获取正面和负面的 Twitter 文章,反应公众的舆情态度。
Trend analysis(http://trend.aminer.cn)基于 AMiner 的 2 亿篇论文数据进行深入挖掘,包括对技术来源、热度、发展趋势进行研究,进而预测未来的技术前景。技术趋势分析描述了技术的出现、变迁和消亡的全过程,可以帮助研究人员理解领域的研究历史和现状,快速识别研究的前沿热点问题。
下图是当前情感计算领域的热点技术趋势分析,通过 Trend analysis 分析挖掘可以发现当前该领域的热点研究话题 Top10 是 Affective Computing、 Social Robot、 Emotion Recognition、 Human Computer Interaction、 Feature Extraction、 Support Vector Machine、 Facial Expression、 Human RobotInteraction、 Behavioural Sciences Computing、 Face Recognition。
情感计算发展趋势
根据Trend analysis的分析我们可以发现, 该领域当前最热门的话题是Affective Computing,从全局热度来看, Affective Computing 的话题热度虽然有所起伏, 但从 20 世纪 90 年代开始,热度迅速上升,甚至在五年内超过了此前的话题 Top 1 Emotion Recognition, 并且至今其话题热度始终保持在 Top1,论文的发表数量也较多; Social Robot 的研究热度跟随 Affective Computing同期上升,近几年话题热度更是超越 Emotion Recognition 成为 Top2 话题;另外,前期比较热门的 Feature Extraction 经过了一段时间的低迷期后,也回到了 Top3 的位置。
研究者根据情感计算领域近十年的相关论文,利用大数据分析、机器学习、人工智能等技术手段,建立算法模型及研发 demo 系统,分析挖掘出该领域的技术发展热点。 技术预见图中点的大小表示该技术的热点(主要由相关论文数量的多少决定,相关论文越多,热度越高,点越大),各技术之间的连线表示 2 个技术关键词同时在 N 篇论文中出现过(当前 N 的取值为 5)。
情感计算技术预见图
根据情感计算技术预见图,可以得出情感计算领域相关度最高的技术有 3 项,分别为: feature extraction、 human computer interaction 和 emotion recognition。
按照技术前沿度,可以列出相关的主要技术关键词,以及该技术历年的变化趋势(论文发表数量变化趋势),及重要代表性成果。具体如下图所示 :
情感计算预测热词图
上图中我们可以看出,情感计算领域预测前沿度比较高的前四热词有: autism spectrumdisorder(前沿度为 1428)、 support vector machine(前沿度为 1096)、 deep learning(前沿度为 1058)和 semantic web(前沿度为 1031)。
目前国外已经有一部分研究者开始关注深度情感计算方面的研究,如Ayush Sharma等人利用语言数据联盟(Linguistic Data Consortium,LDC)中情绪韵律的语音和文本,研究韵律特征提取与分类的深层情感识别。随着后续情感方面的深度研究,多模型认知和生理指标相结合、动态完备数据库的建立以及高科技智能产品的加入等将会成为情感计算相关研究的新趋势,从而更好地实现对用户行为进行预测、反馈和调制,实现更自然的人机交互。
如果说目前的传统计算机(包括应用现有智能计算方法的计算机)只包含了反映理性思维(Thinking)的“脑(Brain)”,那么,情感计算将为该机器增添了具有感性思维(Feeling)的“心(Heart)”(这是应用文学方式对机器进行拟人化比喻。
按认知科学讲,感性思维仍源于脑活动)。可以认为,情感计算是在人工智能理论框架下的一个质的进步。因为从广度上讲它扩展并包容了情感智能,从深度上讲情感智能在人类智能思维与反应中体现了一种更高层次的智能。情感计算必将为计算机的未来应用展现一种全新的方向。同时,由此引发出来的理论与应用问题会是层出不穷。
(本文版权归属为AMiner团队独家所有)