高盛人工智能报告中文版:人工智能教科书来了!

admin发布

人工智能、机器人和自动驾驶已成为流行文化的前沿,甚至是政治表述。

人工智能是信息时代的尖端科技。计算的飞跃建立在人类告知计算机如何表现的基础上,计算建立在计算机学习如何表现能够对每个行业有意义的基础上。虽然目前可能被视作在下一个AI 冬天之前的最新承诺和失望循环,这些投资和新技术至少将给我们带来机器学习产品的实实在在的经济利益。

与此同时,人工智能、机器人和自动驾驶已成为流行文化的前沿,甚至是政治表述。但是,我们去年的研究让我们相信这不是一个失败的开端,而是一个拐点。我们将在这个报告里看到,宏观(更多更快的计算和更多数据的爆炸式增长)和更加微观方面(在深度学习方面的有益进展,智能硬件和开源方面的增长)的拐点的原因。

1.人工智能是什么?

人工智能是制造智能机器、可学习计算程序和需要人类智慧解决问题的科学和工程。经典地,这些包括自然语言处理和翻译,视觉感知,模式识别,决策制定等,但应用的数量和复杂性在快速增长。

高盛人工智能报告中文版:人工智能教科书来了!

在这份报告中,我们将大部分分析聚焦在机器学习、人工智能的一个分支、深度学习、机器学习的一个分支。我们总结了二个关键点:

1. 简化地,机器学习是从案例和经验(例如数据配置)中习得的算法,而不是依赖于硬件代码和事先定义的规则。换句话说,不是一个开发者来告诉程序如何区分苹果和橘子,而是算法本身通过喂养数据(训练),自己学会如何区分苹果和橘子。

2. 深度学习的主要发展是现有人工智能拐点的驱动力量之一。深度学习是机器学习的分集。大多数传统机器学习方法和特点(例如,可能预测的输入和属性)由人来设计。特征工程是一个瓶颈,需要有意义的特定技术。在无人管理的深度学习中,重要特征不是由人类来定义,而是由算法学习和创建。

2.什么是神经网络?

神经网络在AI /机器学习的中充当一种模拟人类大脑的计算机体系结构,在其上可以构建AI /机器学习程序。它由聚合的连接节点组成,如人类大脑中的神经元般可以解决更复杂的问题并学习。

什么是深度学习?深度学习是一种需要训练大型神经网络的“深层”层次结构,且每层可以解决问题不同方面的机器学习,从而使系统能解决更复杂问题的。举一个火车的例子,深层学习系统包含了识别火车的不同特征的各个层。例如,底层将标识是否具有窗户。如果答案是肯定的,下一层将寻找是否有轮子,接下来将会识别是否是长方形的车等等。直到这些层共同地将图片识别为火车或彻底否定。随着技术发展,可以支持大型神经网络的训练,深度学习作为增强机器学习能力的方法已经越来越普遍。

3.为什么现在人工智能加速发展?

请记住,我们并不关注于重复独立人类智能且在流行文化中常见的真实、强壮或普遍的人工智能。必然存在潜在突破点,例如谷歌深度思维AlphaGo 系统,不仅击败了世界冠军,而且使用了没有人曾经做过的行为,我们关注人工智能即刻可触达的经济发展领域。深度学习能力方面的主要飞跃成为当前进行中的AI 拐点的催化剂。神经网络,深度学习之后潜在的科技架构,已经存在了几十年,但是过去的5到10年,三件事发生了改变。

1.数据。通过分布于全球持续增长无所不在的互相联系的设备、机器和系统产生的非结构化数据的数量呈现巨大的增长。

2. 更快的硬件。GPU 的再次使用、低成本计算能力的普遍化,特别是通过云服务,以及建立新的神经网络模型,已经极大的增加了神经网络产生结果的速度与准确率。

3. 更好、更普遍可用的算法。更好的输入(计算和数据)使得更多的研发是面向算法,从而支持深度学习的使用。

4.价值创造的主要驱动力

经过深入分析,我们认为与AI 主题相关的利润创造(和损失)可以分解为四个关键输入:人才,数据,基础设施和硅技术。这些投入也同时也是进入的壁垒。

5.中国人工智能现状

根据iResearch 的研究,中国2020 的AI 市场规模将由2015 年的12 亿人民币增长到91 亿人民币。在2015 年,有将近14 亿(年同比增长76%)的资金流入AI 市场。

在政府政策方面,中国发改委联合相关部门在2016 年5 月18 号发布了互联网+和人工智能三年实施计划。规划确定了在六个具体方面支持人工智能的发展,包括资金、系统标准化、知识产权保护、人力资源发展、国际合作和实施安排。规划确立了在2018 年前建立基础设施、创新平台、工业系统、创新服务系统和AI 基础工业标准化这一目标。发改委预计中国的AI 工业会和国际发展水平接轨,同时在系统级的AI 技术和应用方面领先世界市场。

中国已经采取了行动:从提到“深度学习”或者“深度神经网络”的期刊文章数据上看,中国已经超越美国。中国的AI 研究实力同样让人印象深刻,其拥有世界领先水平的语音和图像识别技术。百度在2015 年11 月开发的深度语音2 可以达到97%的准确度,并被MIT 科技评论评为2016 年度十大科技突破。另外,早在2014 年中国香港大学开发的DeepID 在LFW数据集上达到了99.15%的准确度。

高盛人工智能报告中文版:人工智能教科书来了!

中国互联网巨头BAT 引领中国AI 的发展,与此同时,数百个初创公司在不同的AI 细分和应用领域建立服务模型。当前,中国的AI 市场主要分为以下几个领域:

1) 基础服务如数据源和计算平台

2) 硬件产品如工业机器人和服务机器人

3) 智能服务如智能客服和商业智能

4) 技术能力如图像识别和机器学习

根据iResearch 的报告,语音和图像识别分别占有当前中国AI 市场的60%和12.5%。71%的中国AI 公司集中在应用开发上,其他的则聚焦在算法上,其中55%是计算机视觉,13%在自然语言处理,9%在基础机器学习。

我们认为,未来AI 领域的引领者仍将会在美国和中国。

6.机器人:用户界面的未来

机器人是非常具有潜力的范式转换。在以机器人为中心的世界,用户体验从基于点击的行为转向会话(文本或者语音)以及互动从网络或面向应用转向消息或语音平台。换句话说,相比之前的打开三个不同的应用程序分别预约旅行,购买衣服以及参与客户服务,而现在用户只需要通过会话提供信息给提供帮助的机器人,从而完成同样的事情。因此,我们能看到这些对电子商务,客户支持,员工工作流程及工作效率的广泛影响。

1、自然语言处理(NLP)。机器人的期望植根于他们智能或处理自然语言的潜力。

2、消息平台。机器人的兴起与诸如FacebookMessenger,WhatsApp 以及面向企业的Slack 和HipChat 等消息应用的快速增长同步。消息应用程序提供了一种媒介,通过它,机器人可以与iOS,Android 和网络上的用户进行交互。

3、数字个人助理。很多公司一直在使用复杂的算法,机器学习和大数据软件构建推荐引擎,这些推荐引擎的背后是对客户数据以及历史行为的全面分析。这些推荐引擎正在用于影响购买行为,但大部分相同的技术是用于构建数字个人助理,或者能够基于语音命令完成或自动化简单任务的机器人。

4、人工智能生态

高盛人工智能报告中文版:人工智能教科书来了!

7.行业应用

1、农业

到2025 年将达到200 亿美元的潜在市场总额(total addressable market,TAM)。

我们相信机器学习(ML)在以下方面具有潜力:提高农作物产量,减少化肥和灌溉成本,同时有助于早期发现作物/牲畜疾病,降低与收获后分拣相关的劳动力成本, 提高市场上的产品和蛋白质的质量。当我们看到用于收集土壤,天气,航空/卫星图像,甚至听觉数据的传感器的扩散,我们认为,从这些PB 级数据,深度学习算法能帮助洞察(或者是制定)种植时间、灌溉、施肥以及畜牧相关的决策,最终增加农业中土地,设备和人的生产效率。鉴于所使用的所有已确定的技术数字农业将被优化或完全由机器学习和人工智能驱动,我们假设25%的价值创造会累积到机器学习和人工智能的产业链,这将意味着在2050 年1.2 万吨农作物市场中的600 亿美元的潜在市场总额,假设在该时间段内线性分摊,意味着到2025年潜在市场总额大约为200 亿美元。

下图显示不同技术所带来的玉米产量的潜在提高量。

高盛人工智能报告中文版:人工智能教科书来了!

2、零售

预计2025 年,将减少540 亿美元成本,并增加410 亿美元额外收益。

消费者的线下转线上已经给传统零售行业提出了很大的挑战,电子商务出现的同时,也为零售商提供了大量的消费者数据。但是,零售公司应该如何利用手中积累的数据来为消费者提供更好的服务,获取更多利润,这个最重要的问题依然没有得到解决。早期,成功尝试利用这些数据的企业,是通过线上广告技术来更加有效地定位网络上的客户。现在,零售商能够利用不相关的数据集,不仅仅能够优化广告,更能做到优化库存管理、需求预测、客户管理和趋势预测。我们发现AI/ML 可以推动这方面的进步,通过需求预测,可以推动每年价值540 亿美元的劳动效率提升。预计2025 年之前,通过优化定价将在全球范围内实现任意品类,比如服装和鞋类等,超过410 亿美元的年度销售额提升。

高盛人工智能报告中文版:人工智能教科书来了!

3、能源

预计2025 年,将累计节省成本140 亿美元。

石油和天然气是典型的资本密集型行业,常常存在极端条件下的操作。设备的可靠性极端重要,设备故障和过程纰漏对项目收益影响巨大。为避免此种情况,生产企业通常会对设备数量和工程师做多层后手准备。人工智能/机器学习在一定程度上可以提高设备的可靠性,从而降低企业的资本支出和运营支出。收益是巨大的,我们估计石油和天然气行业的资本支出,运营支出和库存管理减少1%,可以在10 年内节省大约1400 亿美元。在能源行业,我们认为一家公司特别适合采用人工智能/机器学习来降低自身的运营成本和客服成本 – 斯伦贝谢(SLB)。

8.人工智能创新:GOOGL(谷歌), AMZN(亚马逊),百度

  • GOOGLE(谷歌)在人工智能领域正在做什么?

在过去二十年中,Google 的搜索算法已经快速发展。从1998 年的PageRank 到2015 年的RankBrain,该公司已经从基于链接的网站排名转变为采用AI 驱动的查询匹配系统,后者能够不断适应那些独特的搜索(占谷歌所有搜索的 15%)。 在云技术方面,公司五月份公布了针对平台的定制化硬件加速器方面取得的进展,一种定制化的 ASIC,亦即 TPU,这一进展对 2015 年开源的机器学习软件库 TensorFlow 进行了补充。过去三年中,在与人工智能相关的收购战中,公司也当仁不让。被收购的公司中,最知名的当属 DeepMind,它提升了 Alphabet 的神经网络功能并已经将其应用于各种人工智能驱动的项目中。

高盛人工智能报告中文版:人工智能教科书来了!

为什么会做这样的事情呢?

Google 是在搜索领域中使用算法的先驱。该公司继续将自然语言处理应用到匹配人们的搜索意图,以达到期望的目标,这也不断加强了公司在该领域的竞争优势。使用TensorFlow,该公司的开源应用程序为其他基于云的平台创建了先例,并允许研究团体利用公司的资源来推进AI 的集成。

  • AMZN(亚马逊)在人工智能领域正在做什么?

亚马逊正在公司内部和云端使用机器学习技术。2015 年 4 月,公司发布 Amazon ML,这款机器学习服务能够为对云数据的使用提供机器学习功能(无需之前的客户经验)。公司紧随谷歌的开源步伐,今年 5 月开源了 DSSTNE,一个针对推荐深度学习模型的的库。通过改善搜索、定制化产品推荐以及语音识别、增加有质量的产品评价,公司内部也在使用机器学习改善端到端的用户体验。

高盛人工智能报告中文版:人工智能教科书来了!

为什么会做这样的事情呢?

借助 AWS,亚马逊成为全球最大的云服务商,可能也是最成熟的人工智能平台。借助Amazon ML,公司成为作为服务的人工智能(AI-as-a-service)生态系统的领先者,将复杂的推理能力带到之前几乎没有机器学习经验的公司办公室当中。无需基于定制的复杂应用,AWS 用户就能使用机器学习训练模型,评估以及优化潜力。

亚马逊推荐引擎使用了机器学习,在匹配用户意图以及可欲结果方面,具有竞争优势,也为公司创造了商机。公司正更加高效地利用收集到的数据合理化用户购物体验,也让电子商务体验更具互动性。随着 DSSTNE 的开源,亚马逊也与其他科技巨头一起,推动科技社区的人工智能进步。

  • 百度在人工智能领域正在做什么?

在2016 年9 月1 日推出了百度的AI 研究,百度大脑,它由三个元素组成:1)、AI 算法模拟人类神经网络,用数百数十亿样品的大量的训练。2)对数十万服务器和许多GPU 集群进行操作的计算能力(图形处理单元)用于高性能计算(HPC); HPC 允许更多可扩展的深度学习算法。 百度是第一个宣布这个架构的组织,正在与UCLA 合作。3)标签数据,百度已经收集了数万亿页的网页,包括几百亿个视频/音频/图像内容,数十亿次的搜索查询以及数百亿次的位置查询。训练特定型号的机器要求非常高的计算能力和4T 数据。

高盛人工智能报告中文版:人工智能教科书来了!

为什么会做这样的事情呢?

人工智能正在改进百度全线产品的用户体验和提升用户粘性,也在推动针对每一用户的定制化高质量内容。建立一个内部平台来运行从网页搜索到广告投放的带有标签数据的深度学习实验,能够预测点击率(CTR),这会直接影响百度的广告投放,因此也是它们目前的主要收益。此外,基于人工智能的技术也能带来更高的 CTR,而且每点击成本的降低也能促进变现。

来源:高盛