基于文本提示词和图像驱动的内容生成方法、设备、介质2025
- 申请专利号:CN202311759693.8
- 公开(公告)日:2025-07-01
- 公开(公告)号:CN117911584A
- 申请人:上海人工智能创新中心
专利内容
(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117911584 A (43)申请公布日 2024.04.19 (21)申请号 202311759693.8 G06T 5/70 (2024.01) (22)申请日 2023.12.20 (71)申请人 上海人工智能创新中心 地址 200232 上海市徐汇区云锦路701号 37、38层 (72)发明人 曾艳红 张倚铭 邢哲宁 方友清 陈恺 (74)专利代理机构 上海科盛知识产权代理有限 公司 31225 专利代理师 宣慧兰 (51)Int.Cl. G06T 11/60 (2006.01) G06V 30/41 (2022.01) G06V 30/19 (2022.01) G06V 20/40 (2022.01) 权利要求书2页 说明书7页 附图2页 (54)发明名称 基于文本提示词和图像驱动的内容生成方 法、设备、介质 (57)摘要 本发明涉及一种基于文本提示词和图像驱 动的内容生成方法、设备、介质,一方面,本发明 对图像驱动任务构建了一个条件编码模块,该模 块能够兼容现有的文本生成图像、文本生成视频 模型,以条件帧和帧间一致性为输入,能更好编 码和保留条件帧的细节;另一方面,本发明对训 练数据集的扩充,除了条件帧、目标条件帧,该数 据集还包含了条件帧和目标条件帧的帧间一致 性,该发明能够有效提高生成视
最新专利
- 一种基于矿井多源数据分析的热害防治方法公开日期:2025-08-08公开号:CN118072248A申请号:CN202410218743.X一种基于矿井多源数据分析的热害防治方法
- 发布时间:2024-06-01 07:25:040
- 申请号:CN202410218743.X
- 公开号:CN118072248A
- 零件结构检测方法、装置、设备及存储介质公开日期:2025-08-08公开号:CN117874846A申请号:CN202311747152.3零件结构检测方法、装置、设备及存储介质
- 发布时间:2024-04-16 07:19:350
- 申请号:CN202311747152.3
- 公开号:CN117874846A
- 一种承灾体脆弱性评估方法及装置公开日期:2025-08-08公开号:CN117874414A申请号:CN202311670219.8一种承灾体脆弱性评估方法及装置
- 发布时间:2024-04-16 07:18:260
- 申请号:CN202311670219.8
- 公开号:CN117874414A
- 宽表稳定性的检测方法、检测装置、存储介质和处理器公开日期:2025-08-08公开号:CN117851407A申请号:CN202311873276.6宽表稳定性的检测方法、检测装置、存储介质和处理器
- 发布时间:2024-04-11 07:28:240
- 申请号:CN202311873276.6
- 公开号:CN117851407A
- 一种落地页创建系统公开日期:2025-08-08公开号:CN117828215A申请号:CN202311638641.5一种落地页创建系统
- 发布时间:2024-04-07 07:24:120
- 申请号:CN202311638641.5
- 公开号:CN117828215A
- 一种基于对等内存访问的GPU合并舒尔补的方法公开日期:2025-08-08公开号:CN117806828A申请号:CN202410088800.7一种基于对等内存访问的GPU合并舒尔补的方法
- 发布时间:2024-04-04 07:25:480
- 申请号:CN202410088800.7
- 公开号:CN117806828A