大模型的诞生标志着人工智能领域中的一个重大进展,它不仅推动了技术和研究的新方向,也为各行各业带来了深远的影响。2023 年,我们见证了“百模大战”,2024 年,我们期待着 AI 2.0 应用的爆发,如果说 To C 市场还在等待一个属于 AI 2.0 Killer App,在降本增效成为主流趋势的今天,To B 市场便成为了 AI 2.0 落地的最佳试验场之一。
随着企业和开发者对 AI 2.0需求的增加,API 平台作为连接开发者和 AI 服务提供者的桥梁,成为AI生态中不可或缺的一部分。API 平台使得开发者能够轻松接入和使用大模型的能力,而无需从头开始构建复杂的 AI 2.0产品和系统。
近日,大模型公司零一万物发布了 Yi 大模型 API 开放平台。所有企业和开发者都可以通过 API 便捷高效地体验 Yi 大模型的能力。
此次 API 开放平台提供了三个 Yi 系列模型:
Yi-34B-Chat-0205:支持通用聊天、问答、对话、写作、翻译等功能。
Yi-34B-Chat-200K:200K 上下文,多文档阅读理解、超长知识库构建小能手。
Yi-VL-Plus: 多模态模型,支持文本、视觉多模态输入,中文图表体验超过 GPT-4V。
零一万物 API 开放平台链接:https://platform.lingyiwanwu.com/
零一万物是由李开复博士所领导的 AI 2.0 公司。致力于打造中国领先的大模型技术团队,并攻克基础大模型和 AI 2.0 核心技术难题,已发布了 Yi 系列开源大模型,在斯坦福、伯克利等权威评测榜单中表现优异,性能直追GPT-4。目前,Yi 大模型已经实现了 200K上下文(可处理约30万中英文字符)的长文本推理,以及支持多种应用场景的多模态模型。
长文本支持30万字汉字,多模态中文图表体验超GPT-4V
目前国内各家大模型都在强调长文本能力,零一万物也将对长文本能力的拓展作为 API 平台更新的重点,并且直接将此能力通过 API 提供给广大的开发者及企业,这不仅提高人机交互的自然性和流畅性至关重要,还能进一步提升 AI 应用应对复杂场景的能力。
其中 Yi-34B-Chat-200K 拥有 200K 上下文窗口,支持输入 30 万汉字(相当于可以一次处理整本《三体1》),读整本小说、科研论文、行业报告都不在话下。API标配长文本能力,可以极大推动 AI 2.0应用在金融、司法、科研等诸多 B 端场景的落地。
此外,值得一提的是,在“大海捞针”的测评中,Yi-34B-Chat-200K 的性能从 89.3% 提升到 99.8%,接近满分。
“大海捞针”测试通过将一个目标句子(作为搜索的“针”)放入一个庞大的随机文档语料库(相当于“大海”)中,然后向模型提出一个问题,这个问题的答案只能通过理解并回忆目标句子中的信息来找到。这意味着 Yi-34B-Chat-200K 在理解、记忆和检索方面的能力得到了极大的增强,这对于开发改善知识管理系统、提高自动问答系统的准确性等应用都非常有价值。
Yi-34B-Chat-200K 大海捞针评测高达 99.8%
《科学怪人》(Frankenstein)被认为是科幻小说的先驱之一,小说中探讨了许多深刻的主题,主要的故事线围绕着弗兰肯斯坦和他所创造的“怪物”之间的关系展开,同时也探讨了弗兰肯斯坦与他的家人、朋友以及其他人物之间的关系。
在实际测试中,Yi-34B-Chat-200K 不仅可以很快读完近300页原版的《科学怪人》,还能清晰的梳理出小说中错综复杂的人物关系,这体现了 Yi 模型在处理超长上下文时出色的复杂内容理解和分析能力
此次零一万物 API 平台的另一亮点是提供了多模态模型 Yi-VL-Plus,支持文本、视觉多模态输入,并面向实际应用场景大幅增强了相关能力:
增强Charts, Table, Inforgraphics, Screenshot 识别能力,支持复杂图表理解、信息提取、问答以及推理。其中中文图表体验超过 GPT-4V。
在 Yi-VL基础上进一步提高了图片分辨率,模型支持 1024*1024 分辨率输入,显著提高生产力场景中的文字、数字 OCR 的准确性。
保持了 LLM 通用语言、知识、推理、指令跟随等能力。
Yi-VL-Plus 对图表、表格、信息图形和截图等视觉内容识别和理解能力的增强,提升了其从复杂的视觉资料中快速提取关键信息、大幅提高数据分析和处理的效率和准确性,这对于 B 端场景下的生产力应用至关重要。
在中文图标场景下,Yi-VL-Plus 的体验超过了 GPT-4V,在实测中,当我们把同一表格分别交给Yi-VL-Plus 和 ChatGPT 处理,Yi-VL-Plus 的准确率超过了 ChatGPT:
Yi-VL-Plus 正确识别了被引用的第十条文献
ChatGPT 未能完成任务
将图表转换为 Markdown 格式的案例中,Yi-VL-Plus 的体验同样超过了 GPT-4V。
Yi-VL-Plus 给出了正确的 Markdown
ChatGPT 未能完成任务
多模态能力是大模型发展的关键方向之一,Yi-VL-Plus 的多模态能力不仅提升了模型的性能和应用范围,也为 AI 2.0技术在各个行业的深度融合和创新应用提供了强有力的支持。Yi-VL-Plus 在中文图表体验超过 GPT-4V,这体现了零一万物充分利用中文语言数据的优势,具有更好的本土化特性和适应性,对于想要开发 AI 应用的本土企业和开发者来说也更加友好、易用。
AI 2.0 重构一切,B 端先行落地
此前,零一万物已经启动了 Yi-34B-Chat-0205 和 Yi-34B-Chat-200K 两个模型的邀测,不少开发者和企业已经借助 Yi 大模型 API,实现 B 端和 C 端的各类应用场景落地,包括类 ChatGPT 的对话助手,将 Yi 模型整合现有产品,实现 Copilot 工具,以及借助 Yi 超长上下文模型构建知识库问答,用于客服、培训等特定知识的问答场景等等,而其带来的业务增量或者降本增效已在不少公司有所体现。
星云爱店是一家互联网和 AI 创业公司,公司的业务包含 2C 的“学术科研助手”,2B 的儿童心理健康诊疗、青少年科学素养培养三大领域。
星云爱店的产品基于大语言模型,例如,在科研学术场景通过大模型帮助用户进行深层次文本资料解读、文献分析以及创造性写作。针对儿童心理健康,提供诊前智能量表,虚拟疗愈空间和诊后个性化关怀。针对青少年科学素养培育计划,利用大模型来辅助制定个性化学习计划,提供学习辅导,评估学习成果,提升学习效果。
不同的业务方向,对大模型提出了不同的要求。因此,找到合适的大模型作为业务可持续发展的底座至关重要。
在科研和心理咨询等场景,在线拒答率,回答的同理心程度也极大影响用户体验。星云爱店 CTO 大董测试过诸多一线大模型,他表示找到兼具 IQ 和 EQ 的平台并不容易。在接入零一万物的 API 之后,“不像某些大模型API接入后,动不动就拒答或者回答文本‘降智偷懒’,Yi大模型IQ在线且EQ出色,测试期间几乎没有拒答,能持续输出高质量有温度的文案,我们相当满意。”
在涉及专业知识学习与解读的案例中,Yi-VL-Plus 给出较为准确的回答。借助 Yi-VL-Plus 的多模态能力,能够结合历史病历和图片信息(脱敏数据),较好地完成对青少年心理健康水平解读。
中国顶级精神卫生医院评价为:较准确
一个在文献综述的应用中,面对复杂任务(涉及找关联、打分、测距、翻译),其他大模型出现了拒绝的情况,而再切换到 Yi 大模型之后,任务顺利执行。
使用某大模型,被拒率高 40%
使用 Yi 大模型,任务未发生拒绝执行,任务完成度较高
深圳市超思维智能是一家生成式 AI方向的创业公司,其技术负责人近期在测试通过大模型进行知识库的挂载,他们通过接入零一万物的 API, 使用 Yi-34B-Chat-200K 完成了知识库挂载的操作,大量学术文档和知识资料得以高效整合,形成了一个动态更新的知识库。利用模型的长文本输入、输出和总结以及关键信息提取的能力,不仅能够高效地整合和管理大量的信息资源,还提升了信息检索的准确性和速度,成为超思维智能多模态开发中的一部分功能。
在实测中,Yi-34B-Chat-200K 完成了对中英文混合表格文档的信息筛选、内容总结,为多语言环境下的文档管理和知识提取提供了新的解决方案。这对于需要管理和分析大量复杂数据的企业和组织来说,是一个极具价值的资源。
专业性学术文档的内容总结提取也能做到高效、准确。
不仅能高效处理和总结文档内部小标题下的详细内容,还能准确识别 PDF 中图片文字信息。通过这种方式,Yi-34B-Chat-200K 可以实现对文档内容的全面把握,包括那些以较为复杂形式呈现的信息,如图表、插图中的文字描述。这一能力特别对于需要处理大量包含图文混排信息的文档非常有用,比如研究报告、技术手册等。
除了 B 端的应用,在 C 端我们同样看到了有趣的案例,闻(网名门耳朵)做 Hifi 音响生意,热心普及古典音乐,同时也是 AI 大模型发烧友,在 Yi 推出200K的 API 后,闻申请了试用,希望借助 Yi 的大模型实现对长文本的翻译。
闻想要翻译的文本是古典专辑小册子,冷门且专业性很高,借助 Yi 大模型的 API,闻也实现了自己的翻译应用,成功翻译了古典音乐文本,并借助大模型改写为相关的科普文本,最终得到了可以发布在自己公众号上的文章。
Yi 模型对非英文语种也能实现良好的翻译效果
闻尝试过市面上的各种大模型和 API,他表示去年想做到这件事情,还只有GPT有较长的接口,能够达到差强人意的效果,但一次性翻译依然不够好。
此前在音乐翻译的流程中,他会三次利用到大模型。第一次是将原文翻译成中文,第二次是提供原文和翻译后的进行校对,第三次是把文章改写成浅显易懂的音乐科普文章,三次可以调用不同的模型接口。而有了 Yi-34B-Chat-200K 的 API 之后,原来的三个步骤可以合并为一步进行。
闻表示,要翻译这种材料除了翻译的能力,也需要比较强的音乐专业的背景,而 Yi 的“长文本能力绝对是非常牛逼的”,借助一些格式规范化的手段,可以完成很好的翻译。
闻(门耳朵)借助 Yi 大模型 API 完成古典乐科普文章的翻译和撰写
兼容 OpenAI API,更强模型在路上
大模型行业日新月异的今天,企业和个人开发者都在思考如何让 AI 应用真正落地,并能面向市场和用户交付。这不仅需要要大模型基础能力的提升,也需要相关工具链及生态的完善和成熟。零一万物此次发布 Yi 大模型 API 开放平台,也是意在进一步搭建基于 Yi 开源大模型的生态系统,从而促进 AI 应用的普及和发展,随着更多企业和开发者使用零一万物官方 API,我们可以预见更多“AI-First”应用将会出现。
目前 Yi 大模型 API 开放平台推出了上新优惠活动,新用户注册即送 60 元(千万级 token),可以在官网了解详情,零一万物 API 开放平台:https://platform.lingyiwanwu.com/
另外,Yi Model API 与 OpenAI API 是完全兼容的,进一步移除了迁移的技术成本,只需修改少量代码,即可完成平滑迁移。
Yi 大模型 API - Python SDK 调用示例
据零一万物官方信息,API 开放平台正式上线之后,还会陆续带来更多更新:
推出一系列的模型 API,覆盖更大的参数量、更强的多模态,更专业的代码/数学推理模型等。
突破更长的上下文,目标 100万 tokens;支持更快的推理速度,显著降低推理成本。
基于超长上下文能力,构建向量数据库、RAG、Agent 架构在内的全新开发者 AI 框架。旨在提供更加丰富和灵活的开发工具,以适应多样化的应用场景。
成为 AI 2.0 时代的第一批掘金者,快来体验 Yi 大模型 API 吧。