2023开源开发者事件回顾:AIGC篇

开源其实不简单 2024-03-06 07:19:23

毫无疑问,开源开发者圈子来看,2023 年是大模型 LLM年、生成式 AI GenAI 年,在《2023 中国开源开发者报告》中,我们也回顾了 2023 大语言模型 LLM 元年的重磅事件,下面就和我们一起回头看看这精彩的一年吧!

以下内容出自《2023 中国开源开发者报告》:https://talk.gitee.com/report/china-open-source-2023-annual-report.pdf

OpenAI 正式发布 GPT-4

2023 年 3 月 14 日,OpenAI 正式推出 GPT-4。GPT-4 是多模态大型语言模型(Large MultiModal Model),这是和 GPT-3 的一个显著区别,它的输入输出不再局限于文本,可以是图像或者是视频。

Anthropic 推出 Claude

2023 年 3 月 15 日,由 OpenAI 前成员创立的 Anthropic 发布对话 AI 产品 Claude,包含 520 亿个参数。与 ChatGPT 类似,Claude 能够执行各种基于文字对话的任务,如文档搜索、摘要、写作、编码,以及响应用户的提问。

四个月后,Anthropic 推出 Claude 2。Claude 2 改进了性能,响应时间更长,可通过 API 访问。此外还上线了面向公众的 beta 网站 claude.ai。

Anthropic 团队由参与 OpenAI GPT-2 和 GPT-3 模型开发的前研究人员组建,专注于开发通用 AI 系统和语言模型,并秉持负责任的 AI 使用理念。

百度文心一言正式亮相

2023 年 3 月,百度全新一代知识增强大语言模型、文心大模型家族的新成员——文心一言 (ERNIE Bot) 正式发布。

李彦宏称:“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”

Meta 开源 Llama 2

2023 年 7 月,Meta 和微软深度合作,正式推出下一代开源大语言模型 Llama 2,并宣布免费提供给研究和商业使用。相比于 Llama1,Llama 2 的训练数据多了 40%,上下文长度是 Llama 1 的 2 倍,并采用了分组查询注意力机制。具体来说,Llama2预训练模型是在 2 万亿的 token 上训练的,微调Chat 模型是在100万人类标记数据上训练的。

谷歌发布最强 AI 模型 Gemini

2023 年 12 月,谷歌发布了其认为规模最大、功能最强大的多模态AI大模型——Gemini,称比 OpenAI 的 GPT-4 更先进。

Sam Altman 被「逐出」OpenAI

2023 年 11 月 17 日,OpenAI 突然发布公告,宣布 Sam Altman 将辞去首席执行官一职,并离开 OpenAI 董事会。现任首席技术官 Mira Murati 将临时担任首席执行官,该任命立即生效。

如此突发的重磅消息震惊了全世界,有人称之为美国硅谷史上最大的“夺权” 事件。经历 105 小时之后,该事件迎来大结局——Sam Altman 重返 OpenAI 担任首席执行官,OpenAI 成立全新董事会,微软将在董事会中获得一个无投票权的观察员席位。

Auto-GPT 横空出世,席卷 AI 圈

GPT-4 发布不久后,一款让这个最强大语言模型能够自主完成任务的开源项 智谱AI 开源ChatGLM-6B大模型目——Auto-GPT 横空出世,在 AI 领域掀起巨大的波澜。它就像是赋予了 GPT-4 记忆和实体一样,让它能够独立应对任务,甚至从经验中学习,不断提高自己的性能。Auto-GPT 是首批将 GPT-4 应用于自动执行任务的程序之一。

最火热 LLM 应用框架 LangChain

LangChain 是封装了大量 LLM 应用开发逻辑和工具集成的开源 Python 库,提供了一套工具、组件和接口,简化创建由 LLM 和聊天模型提供支持的应用程序的过程。

「零一万物」发布 Yi 系列开源大模型

创新工场董事长兼 CEO 李开复今年 3 月创办AI 大模型创业公司“零一万物”。11 月,零一万物推出 Yi-34B 和 Yi-6B 两个开源大模型,对学术研究完全开放。

与此同时,零一万物完成由阿里云领投的新一轮融资,估值已超10亿美元,跻身独角兽行列。

智谱 AI 开源 ChatGLM-6B 大模型

2023 年 3 月,由清华技术成果转化的公司智谱 AI 宣布开源中英双语对话模型 ChatGLM-6B,支持在单张消费级显卡上进行推理使用。

Vercel 发布 “v0”:根据文本生成 UI 界面代码

v0 是一款根据文本生成 UI 界面代码的 AI 产品,只要输入文字提示,即可生成需要的 UI 组件界面。

谷歌官宣 ChatGPT 竞品:Bard

2023 年 2 月,谷歌首席执行官 Sundar Pichai 宣布,他们将在未来几周内面向公众推出由 LaMDA 提供支持的实验性对话式 AI 服务,称为 Bard——与流行的 ChatGPT 展开直接竞争。

陈天奇团队发布 Web LLM:用浏览器跑大模型

2023 年 4 月,陈天奇团队(MLC)发布了一个可将大型语言模型和基于 LLM 的聊天机器人引入 Web 浏览器的项目:Web LLM。一切都在浏览器内运行,无需服务器支持,并使用 WebGPU 加速。

微软开源 JARVIS(贾维斯):用 ChatGPT 控制 AI 模型

2023 年 3 月,微软亚洲研究院和浙江大学的研究团队联合发布论文《HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in HuggingFace》,介绍了一个大模型协作系统。该系统提出了一种让 LLM 充当控制器的新方法,让 LLM 来管理现有的 AI 模型,来完成多模态的复杂 AI 任务,并且使用语言作为通用接口。

京东发布言犀大模型

7 月 13 日,京东全面推出京东言犀大模型,服务千行百业,拥抱产业智能。言犀大模型融合了 70% 的通用数据与 30%京东数智供应链原生数据,致力于面向知识密集型、任务型产业场景,解决真实产业问题。

依托大模型能力,京东云言犀为客户提供涵盖客户服务、营销导购、多模态数字人等多种营服销一体化解决方案。

LLMOps 平台 Dify.AI 代码完全开源

2023 年 5 月,LLMOps 平台 Dify.AI 宣布 46,558 行代码完全开源,并临时决定将开源协议从 AGPL 放宽到 Apache 2.0。

百度推出 AI 编程助手 Comate

2023 年 6 月,百度智能云推出了基于大模型的“Comate”代码助手。

借助文心大模型的理解、推理能力,“Comate” 可实现代码的快速补齐、自然语言推荐代码、自动查找代码错误,全面提升开发者研发效率。

华为云重磅发布盘古大模型 3.0

2023 年 7 月,华为云正式发布盘古大模型 3.0。盘古大模型3.0是一个面向行业的大模型系列,包括“5+N+X”三层架构。

盘古为行业而生,盘古大模型已在金融、金融、制造、医药研发、煤矿、铁路等诸多行业发挥着巨大价值。

谷歌发布 AI 代码编辑器 Project IDX

2023 年 8 月,谷歌宣布推出 AI 代码编辑器 Project IDX,一个基于浏览器的开发环境:集成 AI、支持全栈编程语言、跨平台真机预览、一键部署,用于构建全栈网络和多平台应用程序。

Meta 开源 AI 代码生成大模型 Code Llama

2023 年 8 月,Meta 开源了号称是编程领域 “最先进的大语言模型”——Code Llama,完全免费且可用于研究和商业用途。

蚂蚁集团开源 CodeFuse 代码大模型

2023 年 9 月,蚂蚁集团正式开源代码大模型 CodeFuse——基于蚂蚁基础大模型研发。这是蚂蚁自研的代码生成专属大模型,帮助开发者自动生成代码、自动增加注释、自动生成测试用例、修复和优化代码等。

百川智能发布 Baichuan2-192K 大模型

2023 年 10 月,百川智能发布 Baichuan2-192K 大模型,上下文窗口长度高达 192K,号称是当时全球最长的上下文窗口,能够处理约 35 万个汉字。在上下文窗口长度、长窗口文本生成质量、长上下文理解以及长文本问答、摘要等方面的表现均全面领先 Claude2。

用「磁力链接」开源了 87 GB 的 Mistral 8x7B MoE 模型

2023 年 12 月,有 “欧洲版 OpenAI” 之称的大模型创业公司——Mistral AI用「磁力链接」开源了 87 GB 的 8x7B MoE 模型:Mixtral 8x7B。这是一个开放权重的高质量稀疏混合专家模型(SMoE),采用Apache2.0License 开源。在大多数基准测试中,Mixtral 的成绩都优于Llama2-70B,且推理速度提升了 6 倍。而且在大多数标准基准测试中超过GPT-3.5。

阿拉伯语 AI 大模型 Jais 开源

2023 年 8 月,阿联酋研究团队宣布开源阿拉伯语大模型Jais。Jais是一个经过 130 亿个参数预训练的阿拉伯语和英语双语大型语言模型,在包含720亿个阿拉伯语词块和 2790 亿个英语 / 代码词块的数据集上进行训练。

OpenAI 开发者大会宣布 GPTs 商店

2023 年 11 月 7 日,OpenAI 首届开发者大会(OpenAI DevDay)正式开启。大会上,Sam Altman 宣布了多项重磅变化:GPT-4 Turbo 模型,128k上下文窗口、GPTs 商店、Agent 工具、API 提速降价、更多的API 开放。

以上内容出自《2023 中国开源开发者报告》,本报告为开发者整理了当前 LLM 中最为热门和硬核的技术领域以及相关的软件产品和开源项目;除了 LLM,还有开源开发者圈高亮事件;最后还通过数据反映了 2023 年开源开发者圈子的相关情况。

完整报告可点击下方链接到浏览器查看:

https://talk.gitee.com/report/china-open-source-2023-annual-report.pdf

0 阅读:0

开源其实不简单

简介:感谢大家的关注