都在谈人工智能,但你知道它的潜力、实践意义、障碍是什么吗?
在过去的 250 多年里,技术创新一直是经济发展的根本推动力。这些技术创新中最重要的就是经济学家所说的“通用技术”,包括蒸汽机、电力,以及内燃机。它们中的每一个都催化了互补性创新与机遇的浪潮。举例来说,内燃机让汽车、卡车、飞机、链锯、割草机,甚至大型零售商、购物中心、交叉对接仓库、新供应链以及郊区得以出现。像沃尔玛、UPS 和 Uber 这样拥有多样性的公司到了利用新技术创造新商业模式的方法。
我们这个时代最重要的通用技术就是人工智能,尤其是机器学习,也就是说机器能够持续提高自己的性能,而无须人类明确解释所有这些任务要怎样完成。在过去几年的时间里,机器学习已经变得越来越高效和广泛地使用。我们现在已经能建造出自己学习如何完成任务的系统了。
为什么这件事非常重要呢?有两个原因。第一,人类的知识比我们能表达出的更多,我们不能解释为什么人类能完成那么多的事情,从识别出一张人脸到在古老的亚洲策略游戏围棋中走出绝妙的一招。在机器学习之前,我们无法精确表达出我们的知识,这种无能正意味着我们不能自动化很多事情,而现在我们可以做到了。
第二,机器学习系统是非常出的学习者。这些系统能在广泛的领域中达到超人类性能,包括检测欺诈和诊断疾病等。人们在整个经济领域中都部署了这样出的数字学习者,它们的影响力将会十分深刻。
在商业领域,人工智能在早期通用技术的阶段就被认为拥有变革性的影响。虽然它目前已经被应用于全球上千家公司,但大多数重大的机遇并没有被利用开发出来。随着制造业、零售业、交通运输、金融业、医疗保健行业、法律、广告业、保险业、娱乐、教育业,以及事实上每一个其他领域转变其核心进程和商业模式,并从机器学习中受益,人工智能的影响,在即将到来的这个十年中一定会被放大。现在的瓶颈在于管理、执行,以及商业想象力。
然而,就像很多其他新技术一样,人工智能也催生出了一大批不切实际的期望。我们看到有大量商业计划随意挥洒在机器学习、神经网络,以及各种其他形式的技术方面,但却几乎与其真正的功能没有联系。举个例子来说,简单地把一个约会网站叫做“人工智能驱动的网站”,并不能让它变得更高效,但那或许有助于网站融资。这篇文章将穿过这些喧嚣的噪音,描述出人工智能的真正潜力、它的实践意义,以及它在被采用的过程中面临的障碍。
人工智能今天能够做些什么?
没有基础学编程好学吗“人工智能”这个词是 1955 年由约翰·麦卡锡(John McCarthy)创造的,麦卡锡是达特茅斯学院的一位数学教授,他组织了之后一年那场具有开创意义的人工智能大会。从那以后,也许部分原因是因其令人回味的名称,人工智能这个领域开始崛起,而不仅仅停留在梦幻般的主张和承诺上了。在 1957 年,经济学家赫伯特·西蒙(Herbert Simon)预测,十年之内,计算机将在国际象棋方面打败人类。(事实上,计算机只花了 40 年时间。)在 1967 年,认知科学家马文·明斯基(Marvin Minsky)说:“在一代人之内,创造‘人工智能’这个问题将会得到实质解决。”西蒙和明斯基二人都是知识分子中的巨擘,但他们都错了。所以,对未来突破的戏剧性主张遭到了一定程度的怀疑。
我们先来看看,人工智能现在在做些什么,以及它在以多快的速度发展。最大的两个进步发生在这样两个广阔的领域:感知和认知。在早期的分类中,最有实用性的进步都是跟语音有关的。语音识别还差强人意,但现在有百万计的人们在使用它,想想 Siri、Alexa,以及 Google 的语音助手。你现在在读的这篇文章,最开始是我口述给一台计算机并让它以足够的精确度转写出来的,这样比打字要快。由斯坦福计算机科学家詹姆斯·兰迪(James Landay)和他的同事们进行的一项研究发现,平均来说,语音识别比在手机上打字要倍,其错误率已经由曾经的 8.5%降低到了 4.9%。令人震惊的是,这个显著的改进并不是经
过 10 多年时间才实现的,而仅仅是从 2016 年夏天才开始。
同样地,图像识别也进步得非常惊人。你可能已经注意到,Facebook 和其他应用程序现在可以在发出的图片中识别出你很多朋友的脸,并且提示你给他们贴标签。一个在你智能手机上的应用就能识别出野外的任何一只鸟。在一些公司总部,图片识别甚至正在取代身份证件。视觉系统,比如那些用在自动驾驶汽车上的视觉系统,以前在识别行人方面每 30 帧中就会出现一次错误,而现在它们的错误率比在 3000 万帧中出错一次还要低。图片识别有一个巨大的数据库,叫 ImageNet,它拥有几百万常见的、模糊的或完全怪异的照片,顶级系统的图片识别错误率已经从 2010 年的 30%多,降低到了 2016 年的 4%。
最近几年来,由于采用了基于庞大的或“深度的”神经网络的新方法,图片识别的改进速度迅速加快。视觉系统的机器学习还远非完美,但即使是人类,也可能会在快速识别出一只小狗方面有困难,人们也可能会在根本没有可爱小狗的地方看出小狗来。
小狗还是玛芬蛋糕?图像识别的进步
机器已经在识别相似图像的类别方面取得了长足的进步。
图片识别的错误率
第二个主要改进的方面是认知和问题解决。机器已经战胜了最棒的人类扑克选手和围棋选手,这是一项专家们之前预测需要至少又一个十年的时间才能实现的成就。Google 的 DeepMind 团队用机器学习系统提高冷却数据中心的效率,高达 15 个百分点,即使人类专家已经优化过数据中心,它也还是达到了这个水平。网络安全公司 Deep Instinct 正在使用智能代理来检测恶意软件,PayPal 用智能代理防止行为。使用 IBM 技术的一家新加坡保险公司支持用户自动进行索赔流程,而数据科学平台 Lumidatum 能提供实时建议来改进客户支持系统。
一大批公司在使用机器学习来决定接受华尔街的哪一笔买卖,有越来越多的信用决策都在机器学习的帮助下做出。亚马逊采用机器学习优化库存并改善他们向用户推送的产品推荐。Infinite Analytics 开发了一个机器学习系统,来预测用户是否会点击一个特定的广告,改善全球消费品商品公司的在线广告布局,另一个系统则是为了优化用户在一个巴西网络零售商的搜索和发现过程。第一个系统将广告投资回报率提高了三倍,第二个系统则增加了 1.25 亿美元的年收入。
机器学习系统不仅在很多应用里代替着原始的算法,而且在很多人类曾经表现最好的工作任务中更为出。虽然这个系统还有待改进,它们在 ImageNet 数据库的错误率(大约是 5%)已经达到或比人类水平的表现更好了。语音识别也是这样,即使在嘈杂的环境下,现在也几乎和人类水平持平。机器学习系统达到了这样的门槛,进而为改变工作场所和经济开辟出了新的广阔可能性。一旦以人工智能为基础的系统在某个领域超越了人类的表现,它们就更容易快速广泛传播。
举个例子,比如 Aptonomy 和 Sanbot,它们分别是无人机和机器人制造者,它们正在使用改进过的视觉系统,使很多安保工作自动化。在很多同类公司中,软件公司 Affectiva 正在使用机器学习在特定体中识别快乐、惊讶和气愤等情绪。Enlitic 则是一家使用机器学习扫描医学图像进而帮助诊断癌症的深度学习创业公司,而这样的公司已经有好几家了。
这些都是了不起的成就,但以人工智能为基础的系统,其适用性依然非常狭窄。举个例子,机器学习在拥有数百万图片的 ImageNet 数据库中的出表现,并不意味着它总能“在野外环境中”取得一样的成功,在野外环境中,光线条件、角度、图片分辨率以及情境都可能非常不同。更为根本地,我们可能会惊叹于一个系统能理解中国话并把它翻译成英文,但我们不能指望这个系统理解一个特定中文字的意义,更不用说在北京去哪里吃饭好了。
如果一个人能出地完成一项任务,那很自然也可以假设他有能力完成一些相关的工作。但是机器学习系统就是为了某些特定任务而训练出来的,它一贯的知识并不会扩展延伸。一个典型的谬论就是认为计算机狭窄的理解力意味着它能扩展到更广阔的理解力中,这可能是一个最大的混淆之源,更为夸张的宣称就是认为人工智能能够自己取得进步。我们离具备在多领域中拥有通用智能的机器还非常遥远。
理解机器学习
要理解机器学习,最重要的一点就是明白机器学习代表了一条创造软件的完全不同的道路。举个例子,机器是去学习一件事情,而不是为某一明确结果被明确编程成什么样子。在过去 50 年的绝大多数时间里,信息技术领域的进步及其应用都聚焦于把某种已有的知识和程序编成指令,再把这些指令植入机器中。确实,“编程”这个词总是意味着这样一种艰苦的过程,即开发者把自己头脑中的知识转化成一种机器能理解和执行的格式。这种方法有一个根本上的弱点:我们现有的很多知识都是大家心照不宣的,也就是说我们无法完全解释它们。对我们来说,写下每一条指令让另一个人明白如何骑自行车、如何识别出一个朋友的脸庞,这几乎是不可能的。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论