玩酷网

Matheus Lima在自己的博客中列出了他心目中计算机科学史上最具影响力的

Matheus Lima在自己的博客中列出了他心目中计算机科学史上最具影响力的 7 篇论文及其入选原因。翻译如下:

⭐“论可计算数及其在判定问题上的应用”(1936 年)

作者:艾伦·图灵

现在是 20 世纪 30 年代,“可编程机器”听起来像是科幻小说里的东西。然后艾伦·图灵出现了,他为计算机在理论上可以做什么奠定了基础。他勾勒出了一种假设的“图灵机”,证明了如果某件事是可计算的,那么一台机器(原则上)就可以处理它。

💡核心思想:图灵的简单模型——只有一条带子、一个用于读/写的磁头和一组有限的状态,成为了所有现代计算的鼻祖。它从纯粹的机械意义上定义了什么是可解决的(以及什么是不可解决的),基本上为我们提供了数字问题解决的“游戏规则”。

💡为何它在今天很重要:现有的每一个编程语言、每一段代码都在遵循图灵的规则。即使我们谈论量子计算时,我们仍然会参考图灵描述的边界。这是对 20 世纪 30 年代中期发表的一篇论文的巨大证明。

⭐“通信的数学理论”(1948 年)

作者:克劳德·香农

既然图灵向我们展示了机器能做什么(以及不能做什么),那么我们如何真正地传输信息呢?克劳德·香农出现了,他基本上发明了信息论,因此我们可以以严谨的方式谈论比特、熵和噪声信道。

💡核心思想:香农采用了“信息”的抽象概念,并将其转化为更具可测量性的东西(双关语)。这帮助我们弄清楚如何更有效地打包数据(压缩)以及如何保护数据免受错误(纠错码)的影响,无论我们是将信号发送到太空还是在周五晚上观看 Netflix 流媒体。

💡为何它在今天很重要:每次你发送短信、流式传输视频或在 FaceTime 上给妈妈打电话时,你都在使用香农的想法。相信我,如果没有它们,你将不得不处理更多的乱码音频和混乱数据。

⭐“大型共享数据库的关系数据模型”(1970 年)

作者:埃德加·F·科德

所以,我们可以计算和通信——太棒了。但最终,我们会被埋在成堆的数据中。埃德加·F·科德预见到了这一点,并引入了关系模型,这基本上是我们能够存储和查询数据的原因。

💡核心思想:科德说,“让我们将数据存储在表格中,并用逻辑运算来操作它。”这在现在听起来可能很明显,但在当时却是革命性的。他的蓝图催生了 SQL 和庞大的关系数据库家族,这些数据库为你能想象到的几乎所有银行、零售网站和企业系统提供支持。

💡为何它在今天很重要:即使在 NoSQL 时代,我们组织数据(表格、模式、一致性)的基本概念也可以直接追溯到科德。如果你曾经写过 SQL 查询——这都要归功于他。

⭐“定理证明过程的复杂性”(1971 年)

作者:斯蒂芬·A·库克

既然我们正在高效地存储数据,那么计算本身呢?事实证明,有些问题只是……非常困难。斯蒂芬·库克的论文介绍了 NP 完全性,这个概念基本上是说,“是的,有些任务非常困难,即使是超级计算机也会感到吃力。”

💡核心思想:库克证明了布尔可满足性问题(SAT)是 NP 完全的,这意味着如果你能神奇地快速解决 SAT,你就可以立即解决一大堆其他看似不可能的问题。这为谈论问题的难度创造了一种通用语言。

💡为何它在今天很重要:每当你看到问题描述中的“NP 难”时,或者想知道为什么路径优化会耗尽你的 CPU 时,那就是库克的遗产。它导致了算法、密码学以及寻找高效解决方案(或至少是合适的近似值)方面的巨大发展。

⭐“分组网络互连协议”(1974 年)

作者:温顿·G·瑟夫和罗伯特·E·卡恩

太好了,我们有难题要解决,有数据要存储——但我们如何将所有这些计算机连接起来呢?瑟夫和卡恩的 TCP 将孤立的网络变成了一个互连的网络,让数据以微小的数据包在全球范围内跳跃。

💡核心思想:他们创造了一种通用语言,让不同的网络可以进行通信。数据包被拆分,通过各种路径传输,并在另一端重新组装。这种灵活性为全球连接打开了大门——不需要单个庞大的网络。

💡为何它在今天很重要:简而言之?几乎整个互联网。每当你浏览网页、发送电子邮件或安全地登录你的银行网站时,你都在依靠 TCP/IP 来可靠地传输这些比特。当然,一些实时应用程序可能会使用 UDP,但基于 IP 的网络的核心思想——由瑟夫和卡恩提出——仍然将我们所有的设备统一在一个全球网络下。

⭐“信息管理:一项提案”(1989 年)

作者:蒂姆·伯纳斯-李

说到 TCP/IP——一旦机器可以轻松地相互通信,蒂姆·伯纳斯-李问道,“我们如何让这个东西对每个人都友好呢?”这就是万维网诞生的原因。

💡核心思想:伯纳斯-李提出了一种全球超文本系统,包括超链接、URL 和 HTTP。突然之间,世界各地的文档不再是孤立的;它们被“织”在一起,将互联网变成普通人(不仅仅是科学家)可以浏览的东西。

💡为何它在今天很重要:我们生活在网络上。无论是社交媒体、在线购物,还是凌晨 3 点阅读晦涩难懂的博客文章,这一切的种子都来自这个简单的提案。它永远改变了我们分享知识的方式。

⭐“大型超文本网络搜索引擎的剖析”(1998 年)

作者:谢尔盖·布林和拉里·佩奇

一旦伯纳斯-李的网络爆发,它就变成了一个由链接、页面和猫咪表情包组成的丛林。谢尔盖·布林和拉里·佩奇决定驯服这个丛林。他们基于链接分析的方法演变成了我们现在称之为“谷歌”的搜索引擎。

💡核心思想:他们引入了 PageRank,它将链接视为信任投票,而不仅仅是计算关键字的新维度。结果是相关搜索结果的巨大飞跃,使网络感觉……可搜索。

💡为何它在今天很重要:在谷歌中输入一个问题并获得即时答案?这就是 PageRank(以及随后的许多创新)在起作用。它重新定义了我们在线导航信息的方式,并开启了一个数据驱动技术的新时代——广告、分析、机器学习,应有尽有。

------------------------------------------------------------

额外奖励(差点入选的 5 篇)

⭐“符号表达式的递归函数及其机器计算”(1960 年)——约翰·麦卡锡

介绍了 Lisp 和函数式编程风格,这些风格仍然渗透到现代语言和框架中。

⭐“被认为有害的 Go To 语句”(1968 年)——艾兹格·迪科斯彻

一篇简短但激烈的社论,认为 goto 会导致混乱、非结构化的代码,从而引发了结构化编程革命。

⭐“时间、时钟和分布式系统中事件的排序”(1978 年)——莱斯利·兰波特

你无法在分布式系统中完美地同步实时时钟,因此你需要逻辑时钟。如果你对分布式计算感兴趣,这是一篇必读的文章。

⭐“没有银弹——软件工程的本质和偶然”(1986 年)——弗雷德·布鲁克斯

布鲁克斯认为,没有单一的魔法可以解决软件开发的固有复杂性。几十年后,当我们在框架或方法论中追逐“下一个大事件”时,他的信息仍然是一个清醒的提醒,即有些问题就是很困难。

⭐“注意力就是你所需要的一切”(2017 年)——Vaswani 等人

GPT 和其他知名人工智能模型背后的 Transformer 架构。如果你对大型语言模型印象深刻,这里是你的蓝图。

结论:

这些天,我们被新事物淹没:新鲜的语言、令人兴奋的人工智能突破、量子跃迁,以及本周的 JavaScript 框架。这一切都非常令人兴奋,但问题是:基础很重要。没有它们,我们只是堆砌新的玩具,而没有完全理解我们正在构建的基础。这篇文章中的论文提醒我们,我们的核心概念——数据结构、算法、网络本身——的起源。