发明

基于轮廓与文本引导的两阶段图像生成方法2026

2024-04-21 07:19:43 发布于四川 2
  • 申请专利号:CN202410048799.5
  • 公开(公告)日:2026-02-06
  • 公开(公告)号:CN117893629A
  • 申请人:杭州万维镜像科技有限公司|||杭州电子科技大学|||杭州鸿雁电器有限公司
摘要:本发明公开了基于轮廓与文本引导的两阶段图像生成方法。首先基于文本特征与图像特征的相似度,从图库选择一张原始图像。对该原始图像进行边缘检测,生成轮廓图。构建扩散模型,进行两阶段训练,在第一阶段使用文本编码进行网络训练。在第二阶段使用图像编码进行网络训练,从而减少生成图像的不确定性,提高一致性,并且可以加快模型的训练速度。最后使用训练后的网络进行噪声预测,生成图像的隐空间表征,并转化到像素空间中,输出期望的图像。该方法在智能家居中可以有多种应用,为用户提供更直观和个性化的交互体验,以及改善生活质量,有极高的实用价值。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117893629 A (43)申请公布日 2024.04.16 (21)申请号 202410048799.5 G06F 16/583 (2019.01) G06N 3/0455 (2023.01) (22)申请日 2024.01.12 G06N 3/0464 (2023.01) (71)申请人 杭州万维镜像科技有限公司 G06N 3/047 (2023.01) 地址 310063 浙江省杭州市西湖区西溪路 G06N 3/0475 (2023.01) 525号C楼784室 G06N 3/08 (2023.01) 申请人 杭州电子科技大学  杭州鸿雁电器有限公司 (72)发明人 常幸 潘常春 王会荣 于建  李益 汪云龙 黄经州 周后盘  (74)专利代理机构 杭州君度专利代理事务所 (特殊普通合伙) 33240 专利代理师 杨舟涛 (51)Int.Cl. G06T 11/00 (2006.01) G06T 7/13 (2017.01)

最新专利