近日,十方融海旗下新智未来委托广东工业大学开展的“复杂场景说话人智能识别技术研发”产学研项目顺利通过验收。评审结果显示,项目核心指标全面达标,多项关键性能超额完成预期目标,标志着十方融海在AI语音交互领域实现重要技术跃升,也为小智AI生态注入更强的技术竞争力。

此次验收会的圆满完成,既是企业与高校协同创新的典型成果,也是AI技术从实验室走向规模化落地的关键一步,为智能家居、智能陪护等场景提供了更可靠、更精准的语音身份识别解决方案。
直击行业痛点 攻坚复杂场景语音识别难题
说话人识别技术是通过语音特征精准判定使用者身份的核心AI能力,广泛应用于智能家居、金融安全、公共安防等领域。但在真实家庭环境中,环境噪音干扰、家庭成员声纹特征接近、用户注册样本偏少等问题,长期制约技术落地效果。
十方融海精准聚焦这一行业共性瓶颈,联合广东工业大学组建专项研发团队,围绕家庭多成员、高干扰、小样本场景开展技术攻关,致力于打造更稳定、更精准、更易用的语音识别能力。

核心指标全面领跑 技术性能超额达标
经过严谨测试与专家评审,该项目在识别精度、响应速度、小样本适配、抗干扰拒识四大维度实现突破性提升:
识别精度显著提升:5人注册场景下,系统等错误率(EER)较基线降低近8%,远超原定5%的目标;
交互响应更实时:基于NVIDIA L20显卡平台,端到端推理速度仅42毫秒,满足实时交互要求;
小样本快速注册:单用户仅需3–5条语音即可完成注册与精准识别,大幅降低使用门槛;
强抗干扰拒识:在含50%未知用户的测试集里,拒识准确率达93.86%,有效过滤非目标用户干扰。
项目团队通过三大创新技术实现突破:研发熵置信度正则化的动态可学习嵌入表示矩阵,优化小样本识别偏差;引入AMSoftmax损失函数提升特征区分度;针对高采样率音频优化推理流程,全面提升系统在复杂环境下的精度、鲁棒性与实时性。

技术赋能小智AI 打造个性化家庭智能交互
此次突破的核心成果将全面集成至小智ESP32系列产品后端,进一步强化十方融海小智AI开源语音交互系统的核心能力。
小智AI作为新智未来自主研发的开源AI语音系统,已登顶GitHub全球热门开源项目,吸引全球近 10 万名开发者共建生态,接入设备超 120 万台,日均处理对话量超 900 万条,并于2025年12月入选深圳市人工智能先锋城市扶持计划。
随着复杂场景说话人身份智能识别技术的落地,小智AI可精准区分家庭成员身份,动态调整音色、语速、推荐内容与交互策略,实现从“听懂指令”到“识别人、懂需求”的升级,为家庭用户带来更智能、更安全、更个性化的语音交互体验。


深化产学研协同 构筑AI语音技术新壁垒
验收会上,校企双方一致认为,说话人身份识别是个性化智能服务的重要入口,在智能家居、银发陪护、车载终端等场景具备广阔应用空间。此次技术突破,不仅强化了十方融海在AI语音交互赛道的差异化优势,也为小智AI构建起坚实的技术壁垒。未来,十方融海将持续推进产学研深度融合,加速前沿技术成果转化,以更领先的AI能力赋能硬件生态与产业应用,为数字中国建设与中国智能科技产业升级持续贡献创新力量。
标题:攻坚AI语音核心技术 十方融海小智AI赋能家庭智能交互新体验
地址:http://www.xunleidownload.com/xhcjxw/50849.html
心灵鸡汤:





