11 月 28 日消息,国家知识产权局信息显示,谷歌有限责任公司申请一项名为“使用说话者嵌入和所训练的生成模型的说话者日志”的专利,公开号 CN 119028321 A,申请日期为 2018 年 9 月。
专利摘要显示,本申请公开了使用说话者嵌入和所训练的生成模型的说话者日志。说话者日志技术,使得能够处理音频数据以生成音频数据的一个或多个细化版本,其中,音频数据的每个细化版本分离单个相应的人类说话者的一个或多个话语。各种实现方式通过以下来生成分离单个人类说话者的话语的音频数据的细化版本:为单个人类说话者生成说话者嵌入,并且使用所训练的生成模型来处理音频数据,以及在处理期间,在确定所训练的生成模型的隐藏层的激活中使用说话者嵌入。基于该处理,在所训练的生成模型上生成输出,并且该输出是音频数据的细化版本。