让你的模型可以听和说3月27日凌晨,阿里巴巴宣布推出并开源其首款全面支持端到端处理的全模态大模型——通义千问Qwen2.
懂的都懂,能干什么微软突破性KBLaM技术:知识直接融入AI模型微软研究团队最新推出的KBLaM技术彻底革新了大语言模型
售价74249人民币的苹果 M3 Ultra 512G内存的Mac Studio目前已是地表性价比最高的能跑deepse
国内第一波官宣弃用DeepSeek的公司出现了国内首批宣布暂停使用DeepSeek服务的科技企业出现了。几天前,Deep
Sakana AI 刚刚发布了一种新方法,可以将 500,000 个开源模型组合在一起 ,以构建新的模型。Evoluti
腾讯玄武实验室居然搞了一个纯cpu推理deepseek r1满q8量化模型的配置。峰值生成速度 7.17 tokens/
Transformer架构迎来历史性突破!刚刚,何恺明LeCun、清华姚班刘壮联手,用9行代码砍掉了Transforme
Gemma 27B刚刚说自己牛逼,马上又来新的了面向未来的AI技术取得重大突破,Mistral Small 3.1现已发
大语言模型不光是可以微调,蒸馏,还可以合并,各种模型的组合,确确实实有点像现代炼金术。人工智能对比人类大脑,最大的优势就
目前最全最完整的人工智能模型后缀命名指南来了1. 技术/算法相关后缀distill/dist - 知识蒸馏,大模型指导小
单卡4070tis加cpu内存能把671B Q4优化到22T/s,也已经很不错了。真是各种小伙伴各种挑战优化。不过我还是
Google DeepMind发布Gemma 3:多模态能力与开放架构的突破性进展Google DeepMind于202
kt和动态量化组合效果还是不错的。
RAGFlow、Haystack、R2R、Storm 开源框架深度对比核心定位与优劣势RAGFlow优势:提
这个不错,值得关注Phi-4系列模型上新了!56亿参数Phi-4-multimodal集语音、视觉、文本多模态于一体,读
大语言模型领域迎来创举! Inception Labs 推出首款生产级扩散式LLM(Mercury),采用非顺序生成模式
现在AI应用出现冰火两重天的割裂现状,一方面是追捧关注的人,天天有新闻,天天亢奋加焦虑,一方面是压根没用过的,一样受过高
这两天刷屏的AI应用是来自中国的ManusManus 不仅仅是一个只会聊天的对话式 AI 工具,而是一个真正的自主智能体
dify的RAG功能真的好用吗?我看未必,还不如RAGFLOW呢!
DeepSeek开源周项目详情及价值分析项目详情第1天:FlashMLA技术特点:为Hopper GPU优化的高效MLA
签名:强大的无代码零代码数字中台魔方网表的学习资料汇总