发明

基于轮廓与文本引导的两阶段图像生成方法2026

2024-04-21 07:19:43 发布于四川 2

申请专利号：CN202410048799.5
公开（公告）日：2026-02-06
公开（公告）号：CN117893629A
申请人：杭州万维镜像科技有限公司|||杭州电子科技大学|||杭州鸿雁电器有限公司

摘要：本发明公开了基于轮廓与文本引导的两阶段图像生成方法。首先基于文本特征与图像特征的相似度，从图库选择一张原始图像。对该原始图像进行边缘检测，生成轮廓图。构建扩散模型，进行两阶段训练，在第一阶段使用文本编码进行网络训练。在第二阶段使用图像编码进行网络训练，从而减少生成图像的不确定性，提高一致性，并且可以加快模型的训练速度。最后使用训练后的网络进行噪声预测，生成图像的隐空间表征，并转化到像素空间中，输出期望的图像。该方法在智能家居中可以有多种应用，为用户提供更直观和个性化的交互体验，以及改善生活质量，有极高的实用价值。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117893629 A (43)申请公布日 2024.04.16 (21)申请号 202410048799.5 G06F 16/583 (2019.01) G06N 3/0455 (2023.01) (22)申请日 2024.01.12 G06N 3/0464 (2023.01) (71)申请人杭州万维镜像科技有限公司 G06N 3/047 (2023.01) 地址 310063 浙江省杭州市西湖区西溪路 G06N 3/0475 (2023.01) 525号C楼784室 G06N 3/08 (2023.01) 申请人杭州电子科技大学　杭州鸿雁电器有限公司 (72)发明人常幸　潘常春　王会荣　于建　李益　汪云龙　黄经州　周后盘　 (74)专利代理机构杭州君度专利代理事务所 (特殊普通合伙) 33240 专利代理师杨舟涛 (51)Int.Cl. G06T 11/00 (2006.01) G06T 7/13 (2017.01)

基于轮廓与文本引导的两阶段图像生成方法2026

专利内容

最新专利

相关专利