电子书《THE HUNDRED-PAGE LANGUAGE MODELS BOOK》
thelmbook.com/
一本从机器学习的基础知识开始,一步步地建立您对语言模型的理解的书。官网上可以在线阅读但不能下载。
“大型语言模型(LLMs)从根本上改变了机器处理和生成信息的方式。它们正在以前所未有的速度重塑白领工作,其变革性影响堪比个人电脑带来的革命。在劳动力日益自动化的背景下,理解语言模型的数学基础和内部运作原理,对于保持竞争力和维持就业至关重要。
本书将引导您了解语言模型的演变历程,从机器学习的基础知识开始。我们不会一开始就介绍 Transformer,因为这可能会让您感到不知所措,而是会一步步地建立您对语言模型的理解——从简单的基于计数的方法,到循环神经网络,再到现代架构。每个概念都以清晰的数学基础为根基,并辅以可运行的 Python 代码进行说明。
在关于大型语言模型篇幅最大的章节中,您将学习到有效的提示工程技巧,以及如何微调这些模型以遵循任意指令。通过亲自动手实践,您将掌握获得一致输出和根据您的需求调整模型的有效策略。
本书内容包括:
⭐带有直观解释的数学基础
⭐GitHub 上使用 PyTorch 的完整 Python 实现
⭐从简单模型到 Transformer 的自然过渡
⭐每个主题都有实用的 Jupyter Notebook
⭐每章都结合了理论、插图和代码”