AI的风暴，英伟达的黄昏

今天，我们从英伟达开始谈起。在英伟达连续两天下跌，跌幅达到11%，市值消失2220亿美元后，一个问题就变得格外引人关注。它还会继续下跌吗？有两种可能性：第一种，如同80%的人所认为的那样，下周会恢复上涨，因为美股尚属“牛市”，而且英伟达在今年还从未出现过连续三天下跌的情况。本周的下跌仅仅是分拆之后的惯例回调。第二种，英伟达正在复制思科的历史路径，当年思科超越微软成为市值第一后的第二天就开始下跌，之后，主角光环彻底消失，直至跌落尘埃。而且，20%持这种主张的人，提供了一个著名的反指标，就是木头姐在周五买入了大量英伟达的股票。其实这种猜测股价涨跌的游戏并没有什么意义，重要的是，英伟达在未来是否还有价值。毕竟，目前它是极为重要的一块“高地”，是美国在高科技领域仍然能形成领先优势的标志。一、当美国引领的AI变革如新世界的阳光普照大地时，它的阴影也显得格外清晰 AI的发展，并没有给世界科技、经济带来巨大的飞跃，而是先带来了巨大的负累。彭博在上周发表了一篇文章，标题是《AI已对全球能源系统造成严重破坏》，文中称：“ 全球已建成或处于不同开发阶段的数据中心超过7,000个，高于2015年的3,600个。如果这些数据中心持续运行，每年可消耗总计508太瓦时的电力。这比意大利或澳大利亚的年发电总量还要高。到2034年，全球数据中心的能源消耗预计将超过1,580 太瓦时，大约相当于整个印度的用电量。” AI的发展正在吞噬世界的能源，尤其是人类目前的整体能源结构依然脆弱，地区发展不平衡极端显著，在非洲、亚洲甚至欧美，电力保障仍然是一个严峻的挑战，尤其是发生极端天气的时候。在美国国内，硅谷的大科技公司正在不惜一切代价的发展人工智能，而带来的结果就是，对电力需求的急剧增加正在严重威胁美国的能源转型计划和清洁能源的目标。同时，由于电力供应能力的骤然提高，也在挤占和威胁数据中心所在地的居民用电，还有一些初创或正在经营的中小企业，他们的用电需求申请，往往需要经历极为漫长的等待。除了能源，AI吞噬的还有资金，宝贵的发展资金。6月20日，软银的孙正义宣布，准备在休整后进行下一个重大投资，而这一次他选择的投资方向，是一个已经热的足以烫伤任何投资人的赛道——人工智能。在投资Wewor遭到数十亿美元的重大损失后，孙正义一直专注于芯片部门Arm Holdings Plc和围绕人工智能的投资策略。而在6月20日的无线运营商年度股东大会上，他对聚集的软银公司股东说：“我们需要寻找我们的下一个重大举措，不惧怕它是否会成功或失败。软银的主要方向，目前看起来有两个：一是人工智能的初创企业。二是人工智能的电力需求，这部分项目将聚焦美国。据称，孙正义正在寻求高达1000亿美元的资金来资助一个芯片企业（可能是ARM），准备与英伟达公司竞争。当大部分的资金全部流向人工智能，其他的行业要如何发展？AI就像一个吸收营养的巨婴，它吞噬很多东西，但是依然成长缓慢。在之前我分享过，AI对生产率的提升是一过性的，目前，至少在美国，还没有看到生成性AI产生正向现金流收入的成功案例。苹果是准备将OpenAI集合到手机中进行销售，但是一上来就被欧盟泼了冷水，欧盟的信息法案不支持带有AI的苹果手机。那么另外一个大市场中国呢？是否会允许，由美国前国家安全局局长作为董事的OpenAI，借助苹果直接进入中国？我对此表示怀疑。二、回到英伟达，这个公司最大的问题就是“不规矩” 1、6月21日，美国最高法院宣布将审理股东诉英伟达欺骗投资者案。此案发生在2022年5月，Nvidia同意支付给美国证券交易委员会（SEC）550万美元，以解决该机构提出的民事指控：该公司未就其游戏业务芯片销售额的增长中“加密货币挖矿”的重要影响进行适当披露。在2018财年的两个季度里，该公司没有披露加密货币挖矿是其收入增长的一个“重要因素”。这只是英伟达众多“收入控制法“中的一个小细节，也是目前唯一被”抓出来“处理的小问题，随着英伟达对美国的重要性与日俱增，政府对于他的监管愈加宽松。 2、英伟达的大问题究竟是什么？通过“收入控制法“进行大规模的虚增收入。我曾经看过一份内部的研报，详细分析了NVIDIA 10-Q报告中（相当于季报），存在的虚增收入的问题。据10-Q报告表述： “在2024财年第一季度没有客户占总营收的10%或以上。”在2025财年：“两个间接客户将在2025财年第一季度各自占总营收的10%或以上；其中一个间接客户主要通过直接客户B购买我们的产品。两者都归属于计算与网络部门。” “一个直接客户A，占2025财年第一季度总营收的13%；另一个直接客户B，占总营收的11%，两者都归属于计算与网络部门。看到这个链条了吗？客户A，占13%这个没有问题；客户B，占11%，其中一个间接客户主要通过直接客户B购买我们的产品。等于所有客户B的库存完全被卖给了一个匿名的“间接”客户C。英伟达为什么不能直接向客户C销售呢？有两个选项：规避政府的限制性命令，但是这是非法的。SEC会听之任之？C客户无力集中购买，所以B先买，然后以融资租赁的方式卖给C。但是，英伟达在这后面的披露就非常奇怪，“如果最终需求增加或我们的成品供应在季度末附近集中，系统集成商、分销商和渠道合作伙伴增加他们的信用额度的能力有限，这可能影响我们的收入时机和金额。不都已经卖给B确认收入了吗？这个披露的意义何在？接着往下看：英伟达的产品供不应求，这是一个主流印象。但如果真的如此，英伟达应该具有最强势的商业议价能力，因为他们能够在销售中获得75%以上的利润率，但是，英伟达为什么会对他们的客户提供极为非常宽松的销售条件？Q-10中称：“我们的大部分销售都是基于采购订单进行的，我们的客户通常可以取消、更改或延迟产品购买承诺，而无需事先通知我们，也无需支付罚款。” 看到这里，熟悉财务造假的读者可能就会感觉到“熟悉的味道”，所谓的客户B-C，可能只是一个虚增收入的体系而已。或者更简单的为这个体系的运行方式标注一个名称——“刷单”。这也可能是英伟达极度依靠系统集成商、分销商和渠道合作伙伴的最重要的原因。然后，是TW。目前，英伟达每个季度向TW销售数十亿的GPU，但TW的数据中心收入预计到2028年每年只有约2.2亿美元，预计到2028年该地区的总投资为32亿美元。同时，在报告中还有这样一段描述： “例如，与2025财年第一季度新加坡收入相关的大部分货物都运往了美国或台湾。” 3、研报虽然说的极尽晦涩，但是在合理怀疑的情况下，很容易厘清脉络。英伟达的收入存在重大的虚增可能性：第一类、正常销售，比如客户A；第二类，刷单系统，比如客户B-C；第三类，灰色收入，比如TW。（转运回美国的部分，可能涉及B-C体系）问题来了，英伟达这套手法，当年安然也用过。但是能用多久呢？ 4、除了这些，英伟达还有一直广泛被诟病的另一条收入控制体系：英伟达——股权投资初创公司——初创公司以购买GPU为由进行融资——以GPU进行抵押。英伟达投资的这种初创公司有数十个。不过以上，目前还掩盖在“合规”而且“令人振奋”的财务报表之下，问题是什么时间，被谁掀开？但是这是一个“软肋”，当资本想要做空英伟达的时候，将会非常容易。不过，这些都还不是英伟达的致命威胁。三、颠覆英伟达的，只有世界不再需要“那么多的GPU” 按照惯例，英伟达通过CUDA建立的护城河几乎是牢不可破的，但是有一个极为重要的前提——只要GPU在大规模语言模型（LLM）创建中仍然是关键。但是，变革已经到来。最近有两篇论文引发广泛的关注： ShiftAddLLM: 这是来自加州大学圣克鲁兹分校的研究团队开发的模型Accelerating Pretrained LLMs via Post-Training Multiplication-Less Reparameterization“（通过后训练的无乘法重新参数化加速预训练的大规模语言模型”）。这篇论文提出了一种称为ShiftAddLLM的方法，通过后期训练的移位和加法重新参数化，消除了对矩阵乘法的依赖。这种方法将每个权重矩阵量化为二进制矩阵，并与分组缩放因子配对，将乘法操作重新参数化为激活和缩放因子之间的移位，以及根据二进制矩阵进行查询和加法操作。该方法在减少内存使用和提高能效方面显示出显著优势。 Scalable MatMul-free Language Modeling （可扩展的无矩阵乘法语言建模）。这篇论文展示了一种完全消除矩阵乘法的语言模型架构。在实验中，这种无矩阵乘法模型在参数规模高达27亿时表现出与目前最先进的Transformer模型相当的性能，并在内存使用方面显示出显著的优化。这种架构在推理过程中通过定制的硬件解决方案实现了极低的功耗，向脑类效率靠拢。这两篇论文共同展示了在大规模语言模型训练中不再依赖GPU的可行性，并且根据专家认定，具有很强的可操作性。这种颠覆性的变革，足以让英伟达成为下一个思科。我不喜欢英伟达，因为它是一个建立在沙丘上的王国，随时有可能随风而逝。和它的CEO一样，充满虚幻的激情，但是却没有脚踏实地的品质。

玩酷网

诗意士仪