首页 健康生活文章正文

谷歌申请经检索增强的文本到图像生成专利,使用文本到图像模型生成输出图像

健康生活 2025年08月12日 15:11 1 admin

金融界2025年8月12日消息,国家知识产权局信息显示,谷歌有限责任公司申请一项名为“经检索增强的文本到图像生成”的专利,公开号CN120476395A,申请日期为2023年09月。

谷歌申请经检索增强的文本到图像生成专利,使用文本到图像模型生成输出图像

专利摘要显示,用于使用文本到图像模型并且以输入文本和从多模态知识库中选择的图像和文本对为条件生成输出图像的方法、系统和设备,包括编码在计算机存储介质上的计算机程序。在一个方面,一种方法包括:在多个时间步中的每一个处:生成该时间步的第一特征图;基于一个或多个邻居图像和文本对与输入文本的相似度选择该一个或多个邻居图像和文本对;对于一个或多个邻居图像和文本对中的每个邻居图像和文本对,生成该邻居图像和文本对的第二特征图;在一个或多个第二特征图上应用注意力机制以生成关注的特征图;以及生成输出图像的针对该时间步的经更新的中间表示。

本文源自金融界

发表评论

泰日号Copyright Your WebSite.Some Rights Reserved. 网站地图 备案号:川ICP备66666666号 Z-BlogPHP强力驱动