一种篇章级别多尺度文本韵律分析方法、装置和设备
- 申请专利号:CN202310347958.7
- 公开(公告)日:2025-06-06
- 公开(公告)号:CN116386595A
- 申请人:清华大学
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116386595 A (43)申请公布日 2023.07.04 (21)申请号 202310347958.7 (22)申请日 2023.04.03 (71)申请人 清华大学 地址 100084 北京市海淀区清华园1号 (72)发明人 魏宪豪 贾珈 吴志勇 李翔 (74)专利代理机构 北京润泽恒知识产权代理有 限公司 11319 专利代理师 苟冬梅 (51)Int.Cl. G10L 13/10 (2013.01) G10L 25/30 (2013.01) 权利要求书3页 说明书12页 附图3页 (54)发明名称 一种篇章级别多尺度文本韵律分析方法、装 置和设备 (57)摘要 本发明中提供了一种篇章级别多尺度文本 韵律分析方法、装置和设备,所述方法包括:将待 分析文本拆分为多个语句;利用话语级别多尺度 文本韵律分析模型对多个语句进行处理,得到每 个语句对应的局部韵律嵌入序列特征和句子级 别话语特征;将多个语句的句子级别话语特征输 入到长短期记忆网络进行处理,得到篇章级别的 全局风格嵌入特征和每个语句对应的具有上下 文信息的句子级别话语特征;将具有上下文信息 的句子级别话语特征映射为具有上下文信息的 音素级别话语特征后和局部韵律嵌入序列特征 A 融合,得到具有上下文信息的局部韵律嵌入序列 5 特征。本发明中能够实现更精细、更连贯的韵律 9 5 6 情感控制,实现通过纯文本自动得到符合文本特 8 3 6 征韵律情感表达的语
最新专利
- 一种环境声音识别分类系统及方法公开日期:2025-07-01公开号:CN116386662A申请号:CN202310097384.2一种环境声音识别分类系统及方法
- 发布时间:2023-07-06 10:27:510
- 申请号:CN202310097384.2
- 公开号:CN116386662A
- 一种支持双线场景的语音识别方法公开日期:2025-07-01公开号:CN116312479A申请号:CN202310041299.4一种支持双线场景的语音识别方法
- 发布时间:2023-06-25 07:16:550
- 申请号:CN202310041299.4
- 公开号:CN116312479A
- 乐音生成装置及乐音生成方法公开日期:2025-07-01公开号:CN113053341A申请号:CN202011138412.3乐音生成装置及乐音生成方法
- 发布时间:2023-06-14 12:21:530
- 申请号:CN202011138412.3
- 公开号:CN113053341A
- 一种语音切分方法、装置、设备及存储介质公开日期:2025-07-01公开号:CN114822513A申请号:CN202210488588.4一种语音切分方法、装置、设备及存储介质
- 发布时间:2023-05-18 12:36:350
- 申请号:CN202210488588.4
- 公开号:CN114822513A
- 基于噪声指标和语音可懂度指标来调整音频和非音频特征公开日期:2025-07-01公开号:CN114830233A申请号:CN202080085359.7基于噪声指标和语音可懂度指标来调整音频和非音频特征
- 发布时间:2023-05-17 11:50:340
- 申请号:CN202080085359.7
- 公开号:CN114830233A
- 一种音频信号处理装置、方法及可存储介质公开日期:2025-07-01公开号:CN114783448A申请号:CN202210442965.0一种音频信号处理装置、方法及可存储介质
- 发布时间:2023-05-17 11:43:360
- 申请号:CN202210442965.0
- 公开号:CN114783448A