研究人员发明了一种新的逻辑系统,有望提升批判性思维和人工智能的能力

人工智能电子侃 2024-11-16 19:16:37

来源:清熙

作者:Alexander V. Gheorghiu - Research Fellow in Logic or Applied Logic, UCL

编译:王庆法

译者注:理解 MIT对大模型数理原理的强有力证明 ,潜在需要一个基本逻辑的调整,本文给了很好的阐释。

新逻辑系统

研究人员发明了一种新的逻辑系统,有望提升批判性思维和人工智能的能力。

我们曾经坚信不移的语言结构正在崩裂。以性别、国籍或宗教为例:这些概念已经不再适合于上个世纪僵化的语言框架。同时,人工智能的崛起迫使我们更加迫切地理解词语与意义及推理之间的关系。

一个由全球哲学家、数学家和计算机科学家组成的团队提出了一种新的逻辑理解方式,称之为“推论主义”(inferentialism)【文献1】。

逻辑的一个传统直觉,至少可以追溯到亚里士多德时代,是逻辑结果应该依赖于所涉及命题的内容,而不仅仅是因为它们“真”或“假”。最近,瑞典逻辑学家达格·普劳维茨(Dag Prawitz)指出,传统的逻辑处理方式实际上完全未能体现这一直觉,这一观察可能会令人意外。

现代逻辑学 —— 科学、工程和技术的坚实基础 —— 存在一个根本性问题。在过去的两千年里,逻辑的哲学和数学基础是基于这样一种观点:意义源于词语所指代的事物。这种观点假设在宇宙中存在着一些抽象的对象类别,比如“狐狸”或“雌性”的概念,并通过这些类别的事实来定义“真理”的概念。

例如,考虑句子“塔米是一只雌狐”(“Tammy is a vixen”)。这句话是什么意思呢?传统的答案是存在一个被称为“雌狐”的生物类别,而名字“塔米”指的是其中的一个。如果“塔米”确实属于“雌狐”这一类别,那么这个命题就是真的。如果她不是一只雌狐,但自认为是雌狐,那么根据标准逻辑,这个陈述将是假的。

因此,逻辑结论仅仅是通过“真理”的事实来得出,而不是通过推理的过程。因此,逻辑无法区分例如4=4和4=((2 x 52) -10)/10之间的差异,因为它们在逻辑上都为真,但我们大多数人都能注意到它们之间的不同。

如果我们的逻辑理论无法应对这一点,那我们又如何能指望教会人工智能更精细、更微妙的思维?在“后真相”时代,我们如何能够辨别对与错?

语言与意义

我们新的逻辑更好地代表了现代语言的使用。其根源可以追溯到奥地利怪才哲学家路德维希·维特根斯坦(Ludwig Wittgenstein)的激进哲学。维特根斯坦在他1953年的著作《哲学研究》中写道:

“对于使用‘意义’这个词的大量情况——尽管不是全部——这个词可以这样解释:一个词的意义就是它在语言中的使用。”【译者注:这是维特根斯坦对米田嵌入的哲学定义,请参考降低大模型幻觉的必由之路】

这一概念让意义更多地与上下文和功能相关联。20世纪90年代,美国哲学家罗伯特·布兰顿(Robert Brandom)将“使用”进一步精炼为“推理行为”,为“推论主义”奠定了基础。

假设一个朋友或者一个好奇的孩子问我们“塔米是一只雌狐”是什么意思。我们会如何回答他们呢?我们可能不会谈论物体的类别。我们更可能会说,这意味着“塔米是一只雌性的狐狸”。

更准确地说,我们会解释说,从塔米是雌狐这一点可以推断出她是雌性,同时她也是一只狐狸。反过来,如果我们已经知道她是雌性并且是一只狐狸,那么我们确实可以断言她是一只雌狐。这就是推理主义对意义的解释;它不再假设宇宙中漂浮着抽象的对象类别,而是承认理解来源于语言元素之间丰富的关系网络。【译者注:降低大模型幻觉的必由之路中讲 米田嵌入就是:关系,关系的关系,关系的关系的关系】

考虑当今的一些争议性话题,比如围绕性别的问题。我们可以避开那些阻碍建设性讨论的形而上学问题,例如关于“男性”或“女性”类别是否在某种意义上是真实存在的。这类问题在新逻辑中没有意义,因为许多人并不认为“女性”一定是一个具有唯一真实意义的类别。

作为一个推论主义者,面对像“塔米是女性”这样的命题,所要问的只是可以从该陈述中推断出什么:有人可能会得出有关塔米生理特征的结论,另一些人则可能考虑她的心理构成,还有人可能会从完全不同的角度理解她的身份。

推论主义的具体应用

那么,推论主义是一个引人入胜的框架,但在实践中它意味着什么呢?在20世纪80年代的一次斯德哥尔摩讲座中,德国逻辑学家彼得·施罗德-海斯特(Peter Schroeder-Heister)命名了一个基于推论主义的领域,称为“证据理论语义学”(proof-theoretic semantics)。

简而言之,证据理论语义学是推论主义的具体实现。近几年,这一领域有了显著的发展。虽然研究结果仍然比较技术化,但它们正在彻底改变我们对逻辑的理解,并且在我们对人类和机器的推理及论述理解方面取得了重大进展。

例如,大语言模型(LLM)的工作原理是通过猜测句子中的下一个词。这些猜测仅仅依赖于常见的语言模式和一个包含试错与奖励的长期训练过程。因此,它们会出现“幻觉”,即构造出逻辑上荒谬的句子。

通过利用推论主义,我们可能可以让它们对所使用的词语有某种理解【译者注:所谓理解即基于关系的推理】。例如,一个大语言模型可能会产生一个历史事实的“幻觉”:“凡尔赛条约于1945年签署,签署方是德国和法国,第二次世界大战之后。” 这是因为这句话听起来合理。但如果有推理理解,它就可以意识到“凡尔赛条约”是第一次世界大战后的事情,是在1918年,而不是第二次世界大战后的1945年。

这在批判性思维和政治领域也可能会派上用场。通过对逻辑结果的合适理解,我们可以自动标记和分类报纸和辩论中的荒谬论点。例如,一位政治家可能会宣称:“我的对手的计划是糟糕的,因为他们有做出错误决定的历史。”

一个具有适当逻辑结果理解的系统会指出,尽管对手有做出错误决定的历史可能是事实,但这并没有对其当前计划的错误之处给出实质性理由。

通过不再将“真”和“假”置于崇高的地位,我们为对话中的辨别能力打开了大门。正是基于这些发展,我们可以声称一个论点是逻辑上有效的,无论是在政治辩论场合、与朋友的激烈争论,还是在科学讨论的世界中。

文献1 Articulating Reasons:

https://sites.pitt.edu/%7Erbrandom/Courses/2022%20Phil%20of%20Language/Reasons%20texts/Brandom_-_Articulating_Reasons.pdf

阅读最新前沿科技研究报告,欢迎访问欧米伽研究所的“未来知识库”

未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或点击本文左下角“阅读原文”进入。

截止到10月25日 ”未来知识库”精选的100部前沿科技趋势报告

1. 牛津大学博士论文《深度具身智能体的空间推理与规划》230页

2. 2024低空经济场景白皮书v1.0(167页)

3. 战略与国际研究中心(CSIS)人类地月空间探索的总体状况研究报告(2024)

4. 人工智能与物理学相遇的综述(86页)

5. 麦肯锡:全球难题,应对能源转型的现实问题(196页)

6. 欧米伽理论,智能科学视野下的万物理论新探索(50页报告)

7. 《美国反无人机系统未来趋势报告(2024-2029 年)》

8. Gartner 2025 年主要战略技术趋势研究报告

9. 2024人工智能国外大模型使用手册+中文大模型使用手册

10. 详解光刻巨人ASML成功之奥妙-241015(94页)

11. CB Insights:未来变革者:2025年九大科技趋势研究报告

12. 国际电信联盟2023-2024年联合国人工智能AI活动报告388页

13. 《人工智能能力的人类系统集成测试和评估》最新51页,美国防部首席数字和人工智能办公室(CDAO)

14. 2024瑞典皇家科学院诺贝尔化学奖官方成果介绍报告

15. MHP:2024全球工业4.0晴雨表白皮书

16. 世界经济论坛白皮书《AI价值洞察:引导人工智能实现人类共同目标》

17. 瑞典皇家科学院诺贝尔物理学奖科学背景报告资料

18. AI智能体的崛起:整合人工智能、区块链技术与量子计算(研究报告,书)

19. OpenAI o1 评估:AGI 的机遇和挑战(280页)

20. 世界知识产权组织:2024 年全球创新指数(326页)

21. 美国白宫:国家近地天体防御策略与行动计划

22. 【CMU博士论文】持续改进机器人的探索,243页

23. 中国信通院:量子计算发展态势研究报告2024年58页

24. 2024年OpenAI最新大模型o1革新进展突出表现及领域推进作用分析报告

25. 【新书】通用人工智能,144页

26. 联合国:《未来契约》、《全球数字契约》和《子孙后代问题宣言》三合一

27. 世界气候组织:2024团结在科学中,守卫地球系统的未来

28. 世界经济论坛 《量子技术助力社会发展:实现可持续发展目标》研究报告

29. 人工智能科学家:迈向全自动开放式科学发现

30. 欧盟:石墨烯旗舰项目十年评估报告

31. 美国信息技术和创新基金会:美国的数字身份之路研究报告

32. 麦肯锡:2024能源转型挑战未来研究报告

33. 联合国贸易与发展会议:2024世界投资报告

34. 兰德:评估人工智能对国家安全和公共安全的影响

35. 兰德:2024评估人工智能基础模型市场的自然垄断条件

36. 经合组织:2015-2022 年生物多样性与发展融资

37. ITIF:中国半导体创新能力研究报告

38. 英国皇家学会:数学未来计划, 数学和数据教育的新方法研究报告

39. 欧盟:10年人类大脑计划创新评估报告

40. GLG格理集团:2024深度解读半导体行业关键趋势和专家洞见报告15页

41. 华为智能世界2030报告2024版741页

42. 联合国:2024为人类治理人工智能最终报告

43. 达信Marsh:2024全球科技产业风险研究报告英文版27页

44. 鼎帷咨询:2024英伟达人工智能发展战略研究报告149页

45. 【博士论文】大语言模型的测试与评价:准确性、无害性和公平性,223页pdf

46. 麦肯锡:2024世界能源产业展望

47. 世界经济论坛《太空:全球经济增长的 1.8 万亿美元机遇》

48. 世界经济论坛:世界“技术先锋”名单100家公司名单

49. 世界经济论坛:2024绘制地球观测的未来:气候情报技术创新

50. 核聚变技术作为清洁能源供应替代来源的全球发展和准备情况

51. 大模型生成的idea新颖性与人类对比研究报告(94页)

52. IQM :2024 年量子状况报告

53. 2024十大新兴技术研究报告

54. 2024地球观测 (EO) 洞察带来的全球价值(58页)

55. 2023-2024世界基础设施监测报告

56. 世界银行:2024世界发展报告,中等收入陷阱

57. 2024国际前沿人工智能安全科学报告132页

58. 斯坦福大学2024人工智能指数报告

59. 美国总统科学技术顾问委员会:《利用人工智能应对全球挑战》63页报告

60. 柳叶刀行星健康:2024地球系统安全与健康评估报告

61. 中国未来50年产业发展趋势白皮书III

62. OpenAI o1系列产品原理与安全最新研究报告(80页)

63. 国家互联网信息办公室:国家信息化发展报告2023年110页

64. 埃森哲:2024年风险研究报告-重大颠覆需要持续重塑英文版39页

65. 36氪研究院:2024年中国城市低空经济发展指数报告41页

66. 美国信息技术与创新基金会:《中国在量子领域的创新能力如何》研究报告

67. 理解深度学习500页报告

68. 鼎帷咨询:2024全球人工智能发展研究报告44页

69. 【伯克利博士论文】大型语言模型迈向能够学习和发现一切的机器

70. 《量子技术:前景、危险和可能性》45页报告

71. 英国皇家学会报告:人工智能在科学、技术、工程和数学领域的应用

72. 未来今日研究所:2024世界技趋势报告(980页)

73. 面向大规模脉冲神经网络:全面综述与未来方向

74. 大模型+知识库市场全景报告

75. 《太空力量的理论基础:从经济学到不对称战争》2024最新94页报告

76. CBInsights:2024年第二季度全球企业风险投资状况报告英文版124页

77. 英国科学院:数据管理和使用:21 世纪的治理(2024),99页

78. 兰德智库:展望2045 一项前瞻性研究探讨未来 20 年全球趋势的影响

79. 世界知识产权组织:2024年世界知识产权报告:让创新政策促进发展

80. 全球灾难风险研究所:评估大型语言模型接管灾难的风险

81. 牛津马丁学院:人工智能风险国际科学评估的未来

82. 联合国贸易和发展署:2024世界投资报告

83. 兰德公司:人工智能军事应用的新风险和机遇

84. 英国皇家学会:AI时代的科学发展趋势研究报告

85. 百页风电行业研究方法论:从中国到世界从陆地到海洋-240902,98页

86. 中国信通院发布《大模型落地路线图研究报告(2024年)》

87. 星河智源:2024年无人驾驶技术全景报告35页

88. 星河智源:2024年光刻机技术全景报告37页

89. 人形机器人行业研究方法论:特斯拉领衔人形机器人的从1到N

90. 兰德:展望2045一项关于未来20年全球趋势影响的前瞻性研究报告英文版45页

91. 《军事创新与气候挑战》2024最新152页报告

92. 麦肯锡:2024困难点:驾驭能源转型的物理现实(196页)

93. 《麻省理工科技评论》万字长文:什么是人工智能?

94. 软件与服务行业:从特斯拉智能驾驶看人形机器人发展路径

95. 中国信通院:中国数字经济发展研究报告2024年82页

96. CB Insights:2024年第二季度全球风险投资状况报告 244页

97. 脑启发的人工智能:全面综述

98. 二十年关键技术跟踪报告

99. 中国首部城市大脑系列建设标准(8项)汇编

100. 麦肯锡2024技术趋势展望报告100页

上下滑动查看更多

0 阅读:0

人工智能电子侃

简介:感谢大家的关注