您的当前位置:首页正文

一种基于说话人嵌入空间的竞争说话人数量估计方法及系统[发明专利]

2021-04-26 来源:步旅网
专利内容由知识产权出版社提供

专利名称:一种基于说话人嵌入空间的竞争说话人数量估计方

法及系统

专利类型:发明专利发明人:曲天书,吴玺宏,彭超申请号:CN202010009945.5申请日:20200106公开号:CN111179959A公开日:20200519

摘要:本发明公开了一种基于说话人嵌入空间的竞争说话人数量估计方法及系统。本方法为:1)利用麦克风阵列采集多说话人的混合多通道信号;2)提取所述混合多通道信号的多通道幅度信息和多通道相位信息;3)利用深度神经网络分别估计所述多通道幅度信息的嵌入空间和多通道相位信息的嵌入空间;4)利用全连接层将两所述嵌入空间映射到说话人嵌入空间;其中,所述多通道幅度信息的嵌入空间、多通道相位信息的嵌入空间和说话人嵌入空间均为相同维度的嵌入空间;5)估计所述说话人嵌入空间中的嵌入向量的平均协方差矩阵;6)对所述平均协方差矩阵做特征值分解,将得到的秩的个数判定为说话人的数量。本发明能够实现更精确的竞争说话人数量估计。

申请人:北京大学

地址:100871 北京市海淀区颐和园路5号北京大学

国籍:CN

代理机构:北京君尚知识产权代理有限公司

代理人:司立彬

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容