歌尔展出前沿创新方案,破译 AI 眼镜“声学密码”

数码 0 6
数码资讯
IT之家 数码资讯 发布于 5小时前
本条新闻为单纯事实消息的时事新闻,转载自IT之家,版权归源站所有,如有侵权,烦请联系我们

7 月 17 日至 19 日,歌尔首届创新大会在歌尔潍坊总部和歌尔青岛全球研发总部同步举行。会上展出 Video、Audio、AI 等领域百余前沿技术成果,其中多项声学创新方案给 AI 眼镜带来更优质声音体验,受到业界关注。

近年来,AI 眼镜成为消费电子市场焦点,其音质效果、隐私保护等痛点也更受关注。

歌尔展出一款超轻薄私密声学方案,使用防漏音设计让 0.5 米处的旁人听不清内容,保护 AI 眼镜佩戴者隐私。方案采用 18mm*10mm 高性能 Rhythm 扬声器,跑道型振膜更符合镜腿形态以节省堆叠空间,具有更高灵敏度和更大音量等特性,配合精细调教的音效算法,让声音更均衡自然。

应对 AI 眼镜在复杂场景下拾音挑战,歌尔推出多 MIC+VPU 传感器拾音方案,能够明显提升降噪水平和语音识别准确率。该方案结合声源定位、指向性拾音、多 MIC 智能策略等技术,使用业内一流水平 DNN 语音算法模型,可显著提升强噪场景下降噪表现;端侧语音分离算法可提升佩戴人和交谈人同时说话时双向识别准确率。值得注意的是,方案为眼镜形态定制开发 VPU 鼻托拾音模组采集骨传导语音信号,结合骨气导融合降噪算法,可让复杂场景的语音唤醒和识别率得到进一步提升。

作为声学领域龙头企业,强大的声学研发能力,注定让歌尔有关 AI 眼镜的声学创新受到更多关注。歌尔拥有 ImmeAudio™ 音效增强、RVF™语音增强、GOVI PERCEPTION™声感知、ACOUSMATIX™ 有源声学等多类端侧音频算法库,经过深度优化后可快速部署在主流芯片平台。为提升方案效果评估准确性,歌尔开发音频效果快速验证系统,能快速完成产品音频效果评估,提前发现产品设计中可改进之处。

歌尔创新大会是面向全体员工的品牌文化活动,特别打造 Goerinno 创新 IP,激发员工的创新思维和动力,促进各部门创新技术交流。首届创新大会主题为“Accelerate Innovation 加速创新”,首次全方位展示企业发展蓝图以及创新技术成果。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

点赞 0 收藏(0)  分享
0个评论
  • 消灭零评论