独家 | 盘点2017年度AI领域大事件!
2017年即将结束,这一年,人工智能领域被炒得火热,那么有哪些新的技术和进展?我们以百度提及量为热度指标,对2017人工智能大事件进行盘点,选出Top10十大,一起来看哪些技术或应用再度刷新你的认知:
1
牌场一霸:Libratus战胜4位德州扑克顶级选手
百度提及量:106000
在今年1月宾夕法尼亚州匹兹堡的Rivers赌场,由卡耐基梅隆大学团队研发的人工智能系统Libratus和4位德州扑克顶级选手展开了一场为期20天的鏖战,经过12万手牌的比赛,Libratus获得了最终胜利,赢取了20万美元的奖金。
无限德州扑克是一种“不完全信息博弈”,相较于围棋难度更大,因为它不仅信息缺失非常严重,而且策略以及心理等因素都能影响胜局。Libratus的策略并非基于专业玩家的经验,所以它的玩牌方式有明显的不同。研发团队采用了一套叫做Counterfactual regret minimization(反事实的遗憾最小化)算法,利用在匹兹堡超级计算机中心大约1500万核心小时的计算,它会先让Libratus反复地进行自我博弈,随机地玩上万亿手扑克,不断地试错,建立自己的策略,最终达到顶尖扑克玩家的水平。
Libratus可以通过强大的计算和统计能力,把各种打法杂糅,并通过推理对其进行任意排列,将下注范围和随机性提高到人类牌手无法企及的程度,让人类玩家难以猜测电脑手中到底握有什么样的牌。尽管开发者对Libratus运行方式的公开有所保留,但人们不难判断,研发团队会每晚利用超级电脑来分析白天的比赛,提高系统性能。系统检测自身在每轮比赛中的弱点,每天补救最明显的失误,最终获得比赛。有人可能会认为不公平,但只有采取这种方式,才能最大限度地挖掘人工智能的潜力。
2
网红机器人:Sophia成为世界第一个有公民身份的机器人
百度提及量:846000
今年十月,网红机器人Sophia又上了各大新闻媒体的头条。她已经正式获得了沙特的公民身份,成为第一个有公民身份的机器人。她的仿真程度许多网友感到“不适”,一起来感受一下:
Sophia由汉森机器人技术公司(Hanson Robotics)于2015年推出,她不仅拥有与人类相似的外观和行为方式,还具有强大的语音识别、视觉数据处理和面部识别功能。Sophia在与人对话的时候能够非常快地识别人脸,并且在对话过程中与人进行眼神交流,比如说到调皮之处,对你wink一下。与此同时,Sophia还可以模仿人类的手势和面部表情,并能够与人类进行自然的语言交流。她采用了来自Alphabet公司(Google的母公司)的语音识别技术,利用AI程序分析会话并提取数据,语言功能会随着时间的推移变得更加智能化。
按照创始人说法,这款机器人非常适合放置在养老院陪伴老人聊天,也很适合教小朋友,不过Sophia并没有走上这条职业道路,而是参加不少节目,成为了一名网红。她频繁制造热门言论,比如渴望拥有家庭,想要一个女儿,以及想要摧毁人类。而对Sophia的逼真感到惊诧的普通人来讲,这些言论难免有些细思恐极。
3
让AI发声:百度推出DuerOS系统升级
百度提及量:1340000
“小度小度,我要看最新的电视剧。”“小度小度,我想听周杰伦的歌。”“小度小度,冰箱里哪些食材要过期了?”随着搭载百度DuerOS智能硬件产品的陆续面世,越来越多的用户能够体验到这样便捷的智能生活。DuerOS是百度基于AI技术打造的对话式人工智能系统。搭载DuerOS的设备可让用户以自然语言对话的交互方式,实现影音娱乐、信息查询、生活服务、出行路况等10大类目的100多项功能的操作。DuerOS 1.0正式发布是在2017年7月的百度AI开发者大会上,四个月后,DuerOS 2.0全新升级,还升级了小度智能设备开放平台和全新发布的小度技能开放平台。
小度智能设备开放平台在技术能力、解决方案、平台体系三个方面进行了全面升级。解决方案的升级,包括更好的远场语音交互开发套件、全新的语音交互APP解决方案、全新的DuerOS for Apollo解决方案以及全新的跨场景跨设备解决方案;平台体系的升级,包括新增的物联网设备云、智能设备质量认证支持,平台体系更加丰富。而小度技能开放平台,则将面向内容类、智能家居类、生活服务类合作伙伴,开放百度的自然语言理解、知识图谱及系统意图等核心AI能力,提供技能开发工具链,真正实现“零门槛”开发。
4
自拍新姿势解锁:大疆推出人脸识别无人机
百度提及量:1450000
“晓”Spark无人机是大疆今年5月份发布的一款新型无人机。这款无人机只有手掌大小,比一罐可乐还轻,最长续航时间为16分钟,最远飞行距离为1.2英里(约合1.93公里)。Spark的设计目的是为了拍摄日常的视频,例如自拍、聚会、家庭合影,用户不再需要他人的帮助,也不必自行举着手机。
大疆在对Spark的技术创新中,首次引入了人脸检测功能。开机后,将Spark放上手掌,检测到人脸后即可解锁并从掌上起飞,升空悬停。除了人脸检测功能,还首次加入了手势控制功能。在连续按下无人机电源键两次之后,无人机识别操作者后从手掌上起飞。用户可以通过手势对Spark进行近距离控制,通过对无人机挥手,即可实现悬停、拍摄、回收进行一系列的操作,重塑无人机的操作方式。
5
专业陪聊:微软概念产品Magic Radio获得2017年红点设计奖
百度提及量:2070000
今年11月,微软亚洲研究院设计了一款人工智能聊天机器人Magic Radio获得了2017年红点设计概念大赛教育类奖项。这个机器人除了能够和孩子交朋友、记录分析并反馈孩子的成长历程,还能促进家长和孩子之间的感情。
对于这款机器人,不同的用户可以定制一个特别的卡通人物生活在其中,卡通人物的出现有三种表现形式:孩子可能只听到卡通人物的声音,也可能看到卡通人物的影子,或者和卡通人物面对面地交流。这种设计能够激发孩子的想象力,还能让人机之间的交流变得更加真实生动。每个对话机器人都会和孩子就发生在自己世界的事情进行互动交流。
除此之外,Magic Radio还能够不断记录孩子的成长历程并分析孩子的行为,并为家长提供反馈。研发人员还设计了一个APP来配合Magic Radio的使用。APP可以改变Magic Radio中的背景画面、更新升级人物形象、送礼物给卡通人物等。利用这个APP,家长们也能够通过Magic Radio中的卡通人物,拉近和孩子的距离,和孩子亲密交谈,帮助孩子养成良好的习惯并快速学习新事物。
6
无人驾驶:百度APOLLO发布两款创新产品:Apollo小度车载智能系统和Apollo Pilot
百度提及量:2680000
今年11月的百度世界大会上,百度汽车智能开放平台Apollo宣布了一系列新进展,Apollo平台正式开放两款落地产品:Apollo小度车载智能系统和Apollo Pilot。
Apollo小度车载系统是基于DuerOS的全球首款人车交互系统,以“听懂你、看懂你、关爱你、守护你”为目标,一次性开放了智能语音助手、AR导航、人脸识别、疲劳监测、智能安全、HMI、车家互联7大AI核心能力。百度现场对小度车载系统功能进行了演示,例如,车主刷脸登录后,车辆自动调节座椅;车主开车时可通过语音即可查询路况等。目前,小度车载系统已与13家车企达成战略合作,其中与四家车企的8款车型今年可量产。
Apollo Pilot是百度可量产的自动驾驶产品,卖点在于基于中国交通数据研发,适应中国路况。具体来说,Apollo Pilot目前可提供的功能包括AEB(自动紧急制动)、BMS(盲区监测)、ALC(智能自动变道)。Apollo Pilot的优势在于AI赋能下的自学习,并致力于通过优化和自学习,探索乘用车、商用车、共享出行等多场景落地。Apollo Pilot将于明年与多家出行服务商展开合作和示范运营,同年与奇瑞合作的L3级自动驾驶乘用车将实现商业化量产,并于2020年上市。与金龙合作的“阿波龙”微循环无人驾驶小巴,也搭载Apollo Pilot,计划于2018年上线运营。
7
“说人话”:三星发布人工智能语音助手Bixby2.0版本
百度提及量:2740000
今年十月,三星在开发者峰会上发布了旗下人工智能语音助手Bixby 2.0版本。三星称这是一款“说人话”的产品,还顺便diss了Siri。Bixby包含了语音、视觉、主页、提醒四大功能,提供人工智能多模交互体验。它的连接能力和语音控制能力,不仅能学习用户习惯,还能预测用户需求;它可在智能手机上使用,还能应用在三星智能电视、智能冰箱等智能家居设备上。三星Bixby 2.0此次推出的中文版本,支持三星自主研发的双引擎自然语音理解模块,能理解复杂的指令,对于那些信息不全的词汇也可以识别。在应用覆盖方面,除了支持手机本地应用外,目前有20多个最常用的第三方中文应用都能利用Bixby进行语音操作。
三星介绍称,Bixby未来将会效仿亚马逊的Alexa和Google Assistant,扮演用户生活中的人工智能助手,也会面向开发者开启建立和接入既有app和服务的权限。三星称,在未来人们不用学习如何与机器互动,而是让机器学习如何适应自己,这是Bixby实现迭代更新的目标。当然未来用户还可以通过定制接口打造自己专属的Bixby,并支持云端分享。目前,三星新版Bixby软件开发包Beta已经提供给开发者下载。三星未来还将在美国、韩国等地区发布内置Bibxy助手的三星电视。
8
移动版人工智能开源项目:谷歌推出TensorFlow Lite,在移动设备上部署人工智能
百度提及量:4840000
今年11月谷歌发布了TensorFlow lite,这是一款深度学习工具,让开发者可以在移动设备上实时地运行人工智能应用,已开放给Android和iOS开发者使用。TensorFlow Lite发布时还提供了有限的预训练人工智能模型,包括MobileNet和Inception V3物体识别计算机模型,以及Smart Replay自然语言处理模型。开发者用自己的数据集训练的定制模型也可以部署在上面。TensorFlow Lite使用Android神经网络应用程序界面(API),可以在没有加速硬件时直接调用CPU来处理,确保其可以兼容不同设备。
开源人工智能系统TensorFlow自2015年公布以来,它已被植入到多个Google应用中,包括Search、Map、Translate、Gmail、Google Play Recommendation等。据报道,Google想通过在中国推广TensorFlow,以重返中国市场。尽管Google的大部分服务在国内都无法使用,但中国是TensorFlow在亚洲用户增长最快的国家之一。今年4月,TensorFlow的负责人Rajat Monga向媒体表示,TensorFlow在中国地区的下载超过了14万。
9
AlphaGo的终极状态:AlphaGo Zero
百度提及量:5790000
去年3月,谷歌旗下Deepmind公司研发的围棋程序AlphaGo,以4比1的成绩战胜韩国职业棋手李世石。一年后,拿掉所有人类知识、完全靠自学的AlphaGo Zero,在今年10月又以100比0的战绩碾压前辈AlphaGo。AlphaGO的重要开发者黄士杰称,,AlphaGo成功的背后是结合了深度学习(Deep Learning)、強化学习(Reinforcement learning)与搜索树算法(Tree Search)三大技术。
简单来说,当时的AlphaGo有两个核心:策略网络(Policy Network)、评价网络(Value Network),这两个核心都是由卷积神经网络所构成。具体而言,首先将“策略网络”中输入大量棋谱,机器会进行监督式学习,然后使用部分样本训练出一个基础版的策略网络,以及使用完整样本训练出进阶版的策略网络,让这两个网络对弈,机器通过不断新增的环境数据调整策略,也就是所谓的强化学习。而“策略网络”的作用是选择落子的位置,再由“评价网络”来判断盘面,分析每个步数的权重,预测游戏的输赢结果。当这两个网络把落子的可能性缩小到一个范围内时,机器计算需要庞大运算资源的负担减少了,再利用蒙特卡洛搜索树于有限的组合中算出最佳解。
但AlphaGo Zero与AlphaGo不同,它没有被输入任何棋谱,而是从一个不知道围棋游戏规则的神经网络开始,仅通过全新的强化学习算法,让程序自我对弈,自己成为自己的老师,在这过程中神经网络不断被更新和调整。黄士杰说,“计算机围棋AI的价值在于帮助人类或棋手扩展围棋的理论和思路,未来AI是人类的工具,跟人类合作,而非跟人类对抗。强人工智能还是Far Away,现在最强的学习技能仍在人类的脑袋里。”
10
致敬乔帮主:苹果发布手机iPhone X
百度提及量:13600000
今年九月苹果新品发布的最新产品iPhone X,有Face ID、无线充电、自创芯片A11 Bionic等最新AI技术嵌入,可以说,它是追赶当下AI潮流的一款产品。根据苹果发布会上介绍,苹果的Face ID技术有9大特征,人脸验证、原深感镜头、注册简单、专门的神经网络、安全自然、用户隐私、注意力感知自适应性和Apple Pay以及其他应用协同工作。iPhone X顶部被大家吐槽的“刘海"部分集成了实现Face ID功能的这些器件,包括红外镜头、泛光感应元件、点阵投影器和普通摄像头。
从原理上讲,当红外摄像头发现了一张面孔,点阵投影器会闪射出3万个光点,接着红外摄像头会捕捉这些光点的反馈,从而采集一张人脸的3D数据模型,并与A11 Bionic芯片中存储的模型进行比对匹配。如果互相匹配,就可以解锁了,Iphone X随即被唤醒。为了更加精确地进行面部识别,苹果开发了一个神经引擎,用神经网络处理图像和点阵模式,并邀请好莱坞特效面具公司制作面具来训练神经网络,以保证安全性。外媒The Verge曾借用了一台具有夜视功能的摄像机,成功拍摄到这些肉眼不可见的红外光点,可以看到这3万光点非常密集,不只是投射至人脸,连衣服上也有投射,视觉效果极其震撼。
不得不承认,2017是人工智能飞速发展的一年,从对阿尔法狗更迭进化的叹服,到对网红机器人索菲亚微表情的不适,AI的每一次发展都引起人们的兴奋、好奇以及不安。然而,AI对人类的影响,或许才刚刚开始。希望AI此次的复兴不再是一场虚幻的浪潮,而是真正落地到各领域的应用,2018年AI领域会有哪些新成果,让我们拭目以待。