极简「机器学习」发展史-刘兴亮的财新博客-财新网

人工智能的发展伴随着神经网络研究的进步带来一波巨大的冲击，人们意识到脱离生物体的意识运行的可能。在这之前，在通向AI的道路上「机器学习」扮演着关键角色。

机器学习是人工智能的重要研究方向和核心实现路径，但不能等同于人工智能本身。人工智能是目标，机器学习是当前最重要的实现方法。

机器学习的发展代表了人类历史上最深刻的智力转型之一，标志着从确定性的机械系统向能够近似人类认知能力的自适应架构的转变。

人工智能概念较为宽泛，目的是让机器具备「像人类一样智能」的能力，包括感知、理解、推理、决策、计划、创造等。简言之就是让机器像人一样思考和工作。

机器学习 (Machine Learning, 简称ML)仅仅是实现人工智能的一种具体方法，它让机器通过数据自动学习规律和模式进行工作，而不是靠人工编写固定规则。对机器学习而言，数据分析和逻辑推演是其主要工作。统计学和数学优化方法构成了机器学习的基础。

举个例子，假如人工智能要实现自动驾驶的话，机器学习只是通过让车看几十万公里的人类驾驶视频，让它自己学会「看到红灯就刹车，看到行人就避让」这些规则并能够在同类状况下做出相应预判，这与一辆自动驾驶的汽车比当然十分悬殊。

说白了，机器学习就是计算机能够从数据中学习模式，而非像过去需要为每条规则进行显式编程。机器学习更接近「归纳」和「总结」的工作模式，它需要吃进大量数据来得出「近似正确」的答案。它通过大量数据总结出统计算法，再把这种算法迁移到陌生的情境和数据上去，就像人类的情境模拟能力。它变得聪明了一些，但还远达不到人工智能的程度。

让我们简单回顾一下「机器学习」的发展历程。

早在电子计算机出现之前几个世纪，人们就开始探索如何将思维机械化，其根源在于相信宇宙的运行遵循逻辑原则，而这些原则可以被物理复制。公元1世纪，亚历山大的希罗率先使用蒸汽动力自动装置和机械剧场，证明了运动和顺序可以通过物理约束进行编程。到了8世纪，巴格达的巴努·穆萨兄弟将这一概念发展到包括可编程自动长笛演奏器，这实际上是「存储程序」概念的早期雏形。

「机器学习」作为一门独立的科学的正式化始于20世纪40年代，当时研究人员开始从生物系统中寻找架构灵感。1943年，沃伦·麦卡洛克和沃尔特·皮茨发表了《神经活动中内在思想的逻辑演算》，其中引入了第一个人工神经元的数学模型。该模型表明，由简单的开关组成的网络可以执行任何逻辑运算，这表明人类思维本身可能可以简化为二进制计算。

1949年，加拿大心理学家唐纳德·赫布出版了《行为的组织》一书，他提出了一种由神经细胞间特定相互作用形成的理论神经结构。他判断，当两个神经元同时放电时，它们之间的连接会得到加强。这一原理如今被称为赫布学习，为神经网络如何在无需显式重编程的情况下适应经验提供了一种生物学机制。同时期及之后，其他研究人类认知系统的研究人员也为现代机器学习技术做出了贡献，包括沃尔特·皮茨和沃伦·麦卡洛克，他们构建了第一个神经网络数学模型，其中包括能够反映人类思维过程的算法。

1950年，艾伦·图灵发表了《计算机器与智能》，他在书中提出了图灵测试，作为机器智能的操作性定义。图灵的过人之处在于他认识到，衡量计算机「思考」能力的最佳方法是看它能否展现出与人类无法区分的行为。

1959年，IBM员工、计算机游戏和人工智能领域的先驱亚瑟·塞缪尔于创造了「机器学习」一词。这是一个标志性事件。他同时还使用了同义词「自学习计算机」，显然，更直观和容易理解。实际上早在1952年，塞缪尔开始开发第一个跳棋程序，该程序被广泛认为是机器学习首次成功应用的案例。

20世纪60年代初，雷神公司开发了一种名「赛博坦」（Cybertron）的实验性「学习机器」，它采用穿孔纸带存储器，利用基本的强化学习技术分析声纳信号、心电图和语音模式。这台机器由人类操作员反复「训练」以识别模式，配备了一个「错误」按钮，使其能够重新评估错误的决策，以此优化自身功能。同一时期，尼尔斯·尼尔森（Nils Nilsson）发表了专著《学习机器》（Learning Machines），该书主要探讨了用于模式分类的机器学习。

1997年，发生了两件意义重大的事件。塞普·霍赫赖特和于尔根·施密德胡伯发表了他们关于长短期记忆网络（LSTM）的研究成果。LSTM是一种循环神经网络架构，能够处理长序列数据而不会出现「梯度消失」问题。与此同时，IBM的「深蓝」击败了世界象棋冠军加里·卡斯帕罗夫。尽管「深蓝」主要依赖于专用硬件和穷举搜索（看起来是笨方法）而非学习，但它的胜利标志着机器在高级认知任务方面开始超越人类的能力。

2000年以后，随着互联网的大规模普及，由此带来了海量数据，大型互联网公司开始利用机器学习来实现诸如搜索引擎、推荐系统、广告投放、欺诈检测等工作，从此，机器学习的商业价值日益凸显。

2010年代是深度学习迅猛发展的时期，机器学习能力获得大发展。在强大的GPU上训练的大型神经网络取得了突破性进展，图像识别技术不断进步。音识别达到实用水平，翻译和游戏制作领域也随之发展。AlphaGo等系统在围棋比赛中击败了顶尖人类棋手，展现了现代人工智能的强大实力。2014年，伊恩·古德费洛等人提出了生成对抗网络（GAN），它可以生成逼真的合成数据。

2020年代则是进入生成式人工智能时代，尤以ChatGPT的出现为标志。大型语言模型出现，图像生成器不断翻新，人工智能助手到处发威。随着这轮AI的大爆发，现代机器学习开始真正影响着科学、医学、金融、交通、教育和创意工作等各个领域。与此同时，它也引发了关于伦理、就业、虚假信息、隐私以及人类与智能机器未来关系等诸多重大议题的讨论。

话题：