ServerlessAPI再添新军,智源语义向量模型BGE-M3上线!

开源其实不简单 2024-08-22 18:10:33

语义向量模型(Embedding Model)是一种将文本或其他数据转换为低维向量表示的技术,使相似的对象在向量空间中距离更近,从而保留其语义信息。

语义向量模型广泛应用于推荐系统、搜索引擎、对话系统、文本分类、信息检索等应用中,这些应用可利用语义向量模型增强用户体验,通过更精准的理解和处理数据来提供更符合需求的服务。

如果你想要以语义向量模型为基础开发相关的应用,却又正在被复杂的流程和劝退的话,先别急!

现在,你可以在 Gitee AI 的 Sererless API 中使用智源研究院推出的通用语义向量模型BGE-M3以及检索排序模型BGE-Reranker-V2-M3 了!

BGE-M3 怎么样?

BGE-M3 支持超过 100 种语言,具备多语言、跨语言检索能力,最大输入长度为 8192,并且一站式集成了稠密检索、稀疏检索、多向量检索三种检索功能,在多个评测基准中达到领先水平。

BGE-M3 是首个集多语言(Multi-Linguality)、多粒度(Multi-Granularity)、多功能(Multi-Functionality)三大技术特征于一体的语义向量模型,极大提升了语义向量模型在现实世界的可用性。

其检索排序子模型BGE-Reranker-V2-M3支持更多语言和更长文本,在多个检索基准上达到顶尖水平。该模型通过分层自蒸馏策略提升推理效率,并新增了「文本+图片」混合检索功能,同时保持了优秀的文本检索性能。

免费试试先

和其他 Sererless API 模型一样,你在购买使用BGE-M3和BGE-Reranker-V2-M3的 API 前可进行简单的在线测试。

在BGE-M3的测试中,可以很快地生成测试内容的数值序列,用以后续自然语言处理等任务中。

BGE-Reranker-V2-M3的测试更加直观,能够以超高的准确度来验证文本相似度。

用 API Run 起来!

在使用 API 前,首先要创建自己的访问令牌,在模型体验的 API 标签中可直接新建访问令牌。

访问令牌用于验证您的身份,可通过访问令牌使用模型引擎 API、Serverless API 等功能。为了保护您的账户安全,请妥善保管您的访问令牌,不要将其共享给他人或暴露在浏览器或其他客户端代码中。

你可以直接在同样的页面选择创建好的访问令牌,将其添加进测试代码中,直接复制使用。

现在你就可以用Python、JavaScript和cURL来使用BGE-M3和BGE-Reranker-V2-M3的 API 了。

用 Python Run BGE-M3import requestsAPI_URL = "https://ai.gitee.com/api/inference/serverless/1RLZEBA2KY1O/embeddings"headers = { "Authorization": "Bearer 你的访问令牌", "Content-Type": "application/json"}def query(payload): response = requests.post(API_URL, headers=headers, json=payload) return response.json()output = query({ "inputs": "Serverless AI 也太好用了,我要安利给其他人!",})用 JavaScript Run BGE-M3async function query(data) { const response = await fetch( "https://ai.gitee.com/api/inference/serverless/1RLZEBA2KY1O/embeddings", { headers: { "Authorization": "Bearer 你的访问令牌", "Content-Type": "application/json" }, method: "POST", body: JSON.stringify(data), } ); const result = await response.json(); return result;}query({"inputs": "Serverless AI 也太好用了,我要安利给其他人!"}).then((response) => { console.log(JSON.stringify(response));});用 cURL Run BGE-M3curl https://ai.gitee.com/api/inference/serverless/1RLZEBA2KY1O/embeddings \ -X POST \ -d '{"inputs": "Serverless AI 也太好用了,我要安利给其他人!"}' \ -H "Authorization: Bearer 你的访问令牌" \ -H "Content-Type: application/json"

以上就是BGE-M3和BGE-Reranker-V2-M3API 的简要使用方法,如果你对推荐系统、文本摘要、问答系统等方向的开发感兴趣的话,相信这两款模型一定会对你有相当大的帮助,现在就点击后面的链接前往 Sererless API 主页试试吧:https://ai.gitee.com/serverless-api

关于Gitee AI

Gitee AI 是开源中国(OSChina)推出的开源人工智能服务平台,旨在降低 AI 应用开发者的准入门槛。您可以在 Gitee AI 平台上找到各种预训练模型,下载并在本地使用这些模型来开发您的 AI 应用。

0 阅读:0

开源其实不简单

简介:感谢大家的关注