当刀片电池重塑全球汽车产业格局,当5G技术领跑国际无线通信新征程,当智能无人机为世界带来全新视野,当湾区的海风穿过研发中心的散热孔,当深南大道的霓虹与实验室光谱同频。“创新之城”深圳,正以每秒万亿次的数据心跳,孕育着这个时代的奇迹。
"鹏城优才"是深圳的造梦引擎,他们以奋斗为源代码,刻录着永续创新的城市基因。他们是科技攻坚者,刺破未知的边界;是人文探索者 ,点亮文明的穹顶;是行业深耕者,铸就产业的基石。深圳市“鹏城优才一站式”服务平台(市人事人才公共服务中心主办)推出《优才面对面》人才访谈栏目,聆听“鹏城优才”解构奋斗经历,讲述精彩故事。
本期优才面对面,邀请到深圳市北科瑞声科技股份有限公司副总裁兼CTO、深圳市“鹏城优才卡”持卡人黄石磊讲述他的科研故事。
在深圳这座被誉为“中国硅谷”的创新之城,人工智能的浪潮正以前所未有的速度重塑科技产业。作为国内AI语音交互领域的领军企业北科瑞声的副总裁,黄石磊的名字始终与“智能语音”“技术突破”“产品研发”等标签紧密相连。
从一名对语音信号处理充满好奇的学子,到主导研发多项核心技术并推动产业落地的科技领军者,他如何用二十年时间,在技术与商业的交汇处开辟出一条创新之路?
从“信号奥秘”到产业领军
“大四时,老师讲到‘从一段语音信号中能同时推算出声音激励信号和传递函数两个信号’,这让我觉得无比神奇。”这个关于"声音密码破译"的启蒙时刻,如同投进湖心的石子,激荡出黄石磊此后二十载的科研求索。2007年获得博士学位后,他在香港科技大学继续研究智能语音技术,直到2009年落脚深圳创业,完成了从学者到产业实践者的关键转身。
作为公司技术负责人,黄石磊主导研发的端侧语音大模型技术,突破了传统云端语音交互的瓶颈,致力于将智能设备从“简单感知”推向“深度认知”。
但技术落地的过程中总是充满挑战。“实验室的优秀算法可能在真实场景中失效,这是最头疼的问题。”黄石磊坦言,面对理论与实践之间的鸿沟,他选择带领团队“抽丝剥茧”,逐一分析因素,结合工程实践优化细节。
例如,在语音识别中引入标点预测技术,通过融合声音、语义和停顿信息,让机器输出的文本更符合人类阅读习惯。这一成果被应用于公司核心产品,显著提升了用户体验。
“它仅仅通过一个麦克风,就可以完整地理解人的语言,再通过可以定制的不同角色的语音、以最自然的人机交互方式再把信息传递给我们。”在采访过程中,黄石磊向我们介绍了北科瑞声为柒牌男装定制的AI生活助手。
这款设备只有掌心大小,小巧的体积却蕴含着大能量。它不仅可以作为柒牌男装的便携式知识库,搭配在衣服上做配饰,还可以独立联网,及时自然地回应使用者的提问和指令。
深圳产业生态助力科研成果快速转化
从华强北的电子元件到南山区的智能终端,从龙岗的精密制造到前海的创新服务,这座城市构建起了完整的电子信息产业链集群。黄石磊感慨道,深圳最吸引他的地方便是其产业生态。
“在这里,我们能快速将实验室的成果转化为实际产品。”当黄石磊结束多年象牙塔中的科研生涯,带着将理论成果转化为实用产品的初心落脚深圳时,他在这里找到了理想与现实的最佳契合点。
这种"上午设计图纸,下午样品成型"的产业转化能力,让黄石磊团队的科研成果得以用前所未有的速度跨越实验室与市场的鸿沟。“特别是在实体产品领域,深圳制造业展现出的高质量高效率,为我们提供了将创意转化为商品的超高速通道。”黄石磊感慨道。
目前,北科瑞声已跻身国家级专精特新“小巨人”企业,是国内极少数具备端侧智能语音交互全链核心技术的公司,实现了语音交互全链条的自主可控。
同时,北科瑞声在政务、医疗、高速交通领域都形成了成熟的实施案例,近两年来,也成功地把这种技术的应用拓展到消费电子领域,在多种智能终端上实现语音交互。
令黄石磊自豪的是,团队近年斩获工信部人工智能产业创新任务“揭榜挂帅”重大项目,并在多语种混合识别、方言口音适配等难题上实现突破。
“这些国家级项目的严苛指标,也倒逼我们的技术上了一个台阶。”目前,黄石磊带领的团队申请的发明专利已超百项,成为企业技术壁垒的重要支撑。
制定国标引领行业,构建智能语音生态枢纽
作为智能语音领域两项国家标准的参编者,黄石磊对技术标准有着深刻认知:"很多的行业,例如通信行业历来标准先行,虽然AI领域技术发展非常迅速,但却长期存在标准滞后问题。我们参与制定智能语音有关的基础标准,就是要打通行业的技术语言体系,实现智能语音交互在不同场景中真正的互联互通。"
这番见解背后,是北科瑞声在产业链中游构建生态枢纽的战略布局。基于"产业链中游"的定位,北科瑞声整合上游基础大模型与各种算力芯片,向下游合作伙伴输出软硬一体化的智能语音解决方案。
通过与行业头部企业的深度协同,其研发的端侧语音交互模组已实现规模化落地,在智能家居、机器人等场景完成设备部署。这种"中间件"模式有效降低了端侧智能的准入门槛,推动AI语音技术走向产业化。
在黄石磊的构想中,智能语音的终极形态将突破现有交互范式:"未来的语音技术应该像电影《钢铁侠》中的‘贾维斯’、《流浪地球》中‘莫斯’一样,不仅能理解语义,更能感知场景和情绪。"
这位兼具技术理想与产业思维的创业者,带领团队在理论与实践的双向奔赴中,持续探索着智能语音技术的边界。他说,“真正的创新不应是理论算法的空中楼阁,而要让每个普通人都能感受到科技的温度。”