一种篇章级别多尺度文本韵律分析方法、装置和设备
- 申请专利号:CN202310347958.7
- 公开(公告)日:2025-06-06
- 公开(公告)号:CN116386595A
- 申请人:清华大学
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116386595 A (43)申请公布日 2023.07.04 (21)申请号 202310347958.7 (22)申请日 2023.04.03 (71)申请人 清华大学 地址 100084 北京市海淀区清华园1号 (72)发明人 魏宪豪 贾珈 吴志勇 李翔 (74)专利代理机构 北京润泽恒知识产权代理有 限公司 11319 专利代理师 苟冬梅 (51)Int.Cl. G10L 13/10 (2013.01) G10L 25/30 (2013.01) 权利要求书3页 说明书12页 附图3页 (54)发明名称 一种篇章级别多尺度文本韵律分析方法、装 置和设备 (57)摘要 本发明中提供了一种篇章级别多尺度文本 韵律分析方法、装置和设备,所述方法包括:将待 分析文本拆分为多个语句;利用话语级别多尺度 文本韵律分析模型对多个语句进行处理,得到每 个语句对应的局部韵律嵌入序列特征和句子级 别话语特征;将多个语句的句子级别话语特征输 入到长短期记忆网络进行处理,得到篇章级别的 全局风格嵌入特征和每个语句对应的具有上下 文信息的句子级别话语特征;将具有上下文信息 的句子级别话语特征映射为具有上下文信息的 音素级别话语特征后和局部韵律嵌入序列特征 A 融合,得到具有上下文信息的局部韵律嵌入序列 5 特征。本发明中能够实现更精细、更连贯的韵律 9 5 6 情感控制,实现通过纯文本自动得到符合文本特 8 3 6 征韵律情感表达的语
最新专利
- 一种车载智能语音交互系统公开日期:2025-07-18公开号:CN116935857A申请号:CN202311040710.2一种车载智能语音交互系统
- 发布时间:2023-10-26 07:23:440
- 申请号:CN202311040710.2
- 公开号:CN116935857A
- 基于可插拔模块的深度学习语音辅助文字识别方法与装置公开日期:2025-07-18公开号:CN116434732A申请号:CN202310111405.1基于可插拔模块的深度学习语音辅助文字识别方法与装置
- 发布时间:2023-07-16 07:20:380
- 申请号:CN202310111405.1
- 公开号:CN116434732A
- 一种基于正则表达式和WFST的TTS文本正则化方法和装置公开日期:2025-07-18公开号:CN116312540A申请号:CN202310276496.4一种基于正则表达式和WFST的TTS文本正则化方法和装置
- 发布时间:2023-06-27 09:43:410
- 申请号:CN202310276496.4
- 公开号:CN116312540A
- 一种Circle-Doppler-let变换方式和声源分离方法公开日期:2025-07-18公开号:CN116312610A申请号:CN202310120976.1一种Circle-Doppler-let变换方式和声源分离方法
- 发布时间:2023-06-27 09:32:270
- 申请号:CN202310120976.1
- 公开号:CN116312610A
- 基于知识追踪的智能对话的系统和方法公开日期:2025-07-18公开号:CN114270435A申请号:CN202080053996.6基于知识追踪的智能对话的系统和方法
- 发布时间:2023-06-18 07:23:290
- 申请号:CN202080053996.6
- 公开号:CN114270435A
- 一种隔声器件、隔声罩、隔声器件控制方法及控制装置公开日期:2025-07-18公开号:CN116259295A申请号:CN202211492959.2一种隔声器件、隔声罩、隔声器件控制方法及控制装置
- 发布时间:2023-06-15 07:05:150
- 申请号:CN202211492959.2
- 公开号:CN116259295A