基于云的生成式人工智能系统使用太多资源,结果证明过于复杂和昂贵。以下是避免这种情况的方法。
云是构建生成式 AI 系统的最简单方法,这就是云收入飙升的原因。然而,其中许多系统都过度设计,这增加了复杂性和不必要的成本。过度工程是一个熟悉的问题。多年来,我们一直在过度思考和过度构建系统、设备、机器、车辆等。为什么云会有所不同?
过度工程是指通过整合不增加实质性价值的特性或功能来设计不必要的复杂产品或解决方案。这种做法会导致时间、金钱和材料的低效使用,并可能导致生产力下降、成本增加和系统弹性降低。
对任何系统(无论是 AI 还是云)的过度设计都是通过轻松访问资源并且对这些资源的使用没有限制来实现的。查找和分配云服务很容易,因此 AI 设计师或工程师很容易添加可能被视为“很高兴拥有”的东西,而不是“需要拥有”的东西。做出一堆这样的决策会导致数据库、中间件层、安全系统和治理系统比需要的多得多。
企业访问和配置云服务的便利性既是福音也是祸根。先进的基于云的工具简化了复杂人工智能系统的部署,但它们也为过度工程打开了大门。如果工程师必须经历一个采购过程,包括为特定的计算或存储服务购买专门的硬件,那么他们很可能会比简单地点击鼠标时更加克制。
轻松配置的危险公有云平台拥有一系列令人印象深刻的服务,旨在满足各种可能的生成式人工智能需求。从数据存储和处理到机器学习模型和分析,这些平台提供了有吸引力的功能组合。事实上,看看云提供商认为设计、构建和部署生成式人工智能系统“必要”的几十种服务的推荐列表。当然,请记住,创建列表的公司也在销售服务。
GPU 就是最好的例子。我经常看到 GPU 配置的计算服务被添加到生成式 AI 架构中。但是,“餐巾纸背面”类型的计算不需要 GPU,而且 CPU 驱动的系统可以很好地工作,只需花费一点成本。
出于某种原因,制造和销售 GPU 的公司的爆炸性增长让许多人认为 GPU 是必需的,但事实并非如此。 当针对特定问题指示专用处理器时,需要 GPU。与其他过度工程错误相比,这种类型的过度工程使企业付出的代价更大。不幸的是,建议您的公司不要使用更高端和更昂贵的处理器通常会不邀请您参加后续的架构会议。
保持预算不断上升的成本与分层的复杂性和额外的云服务直接相关,这些服务通常是出于对彻底性或面向未来的冲动而包括在内。当我建议一家公司使用更少的资源或更便宜的资源时,我经常会遇到这样的情况,“我们需要考虑未来的增长”,但这通常可以通过随着架构的发展而调整架构来解决。这绝不应该意味着从一开始就把钱扔在问题上。
这种包含过多服务的趋势也放大了技术债务。维护和升级复杂系统变得越来越困难和昂贵。如果数据分散在各种云服务中,可能会进一步加剧这些问题,使数据集成和优化成为一项艰巨的任务。企业经常发现自己陷入了一个循环,他们的生成式人工智能解决方案不仅过度设计,而且还需要进一步优化,导致投资回报减少。
缓解过度工程的策略需要采取有纪律的方法来避免这些陷阱。以下是我使用的一些策略:
优先考虑核心需求。专注于实现主要目标所需的基本功能。抵制给它们充气的诱惑。彻底计划和评估。在规划阶段投入时间,以确定哪些服务是必不可少的。从小处着手,逐步扩大规模。从专注于核心功能的最小可行产品 (MVP) 开始。组建优秀的生成式 AI 架构团队。选择 AI 工程、数据科学家、AI 安全专家等,他们分享利用所需内容但又不过分的方法。您可以将相同的问题提交给两个不同的生成式 AI 架构团队,并获得成本相差 1000 万美元的计划。哪一个弄错了?通常,团队希望花费最多。公共云平台的强大功能和灵活性是我们首先利用云的原因,但需要谨慎行事,以避免过度设计生成式人工智能系统的陷阱。深思熟虑的规划、明智的服务选择和持续优化是构建具有成本效益的 AI 解决方案的关键。通过遵守这些原则,企业可以充分利用生成式人工智能的潜力,而不会成为过度设计系统的复杂性和成本的牺牲品。
编译:R
https://www.infoworld.com/article/3715704/the-perils-of-overengineering-generative-ai-systems.html