Stability AI新文本到图像模型DeepFloyd IF 拥有深度文本理解能力当前快讯

日期：2023-05-08 16:11:32 来源：站长之家

编程客栈（）5月8日消息:Staphpbility AI及其多模态 AI 研究实验室 DeepFloandroidyd 宣布发布 DeepFloyd IF 研究版php，这是一种尖端的文本到图像级联像素android扩散模型，并且可以智能地将文本集成到图像中该模型最初仅限于非商业、研究许可使用场景，但计划在未来发布开源版本。

DeepFloyd IF 拥有几个显着的特点，包括:

深度文本指提示词理解能力:该模型使用T5-XXL-1.1作为文本编码器，具有多个文本-图像交叉注意力层，确保提示和图像之间更好的对齐。

(资料图片)

连贯清晰的文本和生成的图像:DeepFloyd IF 可以生成包含具有不同属性和空间关系的对象的图像。

高度逼真:该模型在 COCO 数据集上取得了令人印象深刻的零样本 FID 分数6.66。

纵横比转换:该模型可以生成非标准纵横比的图像，包括垂直、水平和标准方形纵横比。

零样本迁移能力实现图像到图像的转换:该模型可以修改图像的样式、图案和细节，同时保留其基本形式。

以下是 DeepFloyd IF 创建的一些示例:

DeepFloyd IF 的模块化、级联、像素扩散设计由多个协同交互的神经模块组成。该模型在像素空间中工作，使用不同分辨率的单独训练模型以级联方式处理高分辨率数据。这涉及生成低分辨率样本的基本模型和生成高分辨率图像的连续超分辨率模型。

该模型是在包含10亿（图像、文本）对的自定义高质量 LAION-A 数据集上训练的，LAION-A 数据集是 LAION-5B 数据集英文部分的一个子集。DeepFloyd 的自定义过滤器用于删除带水印、NSFW 和其他不当内容。

最初，DeepFloyd IF 是根据研究许可发布的。研究人员旨在鼓励跨领域（如艺术、设计、讲故事、虚拟现实和可访问性）开发新颖的应用程序。为了激发潜在的研究，他们提出了几个技术、学术和伦理研究问题。

技术研究问题包括:

优化 IF 模型以增强性能、可扩展性和效率。

通过改进抽样、指导或微调模型来提高输出质量。

将用于修改稳定扩散输出的技术应用到 DeepFloyd IF。

学术研究问题包括:

探索预训练对迁移学习的作用。

增强模型对图像生成的控制。

通过集成多种模式，将模型的功能扩展到文本到图像合成之外。

评估模型的可解释性，以提高对生成图像视觉特征的理解。

伦理研究问题包括:

识别和减轻 DeepFloyd IF 中的偏差。

评估模型对社交媒体和内容生成的影响。

开发利用该模型的有效假js图像检测器。

DeepFloyd "s hugs Face空间网址: https://huggingface.co/DeepFloyd。

DeepFloyd IF 网址:https://deepfloyd.ai/deepfloyd-if

DeepFloyd IF github项目地址:https://github.com/deep-floyd/IF

标签：

上一篇：申报成功！康和小学三项课题均成功立项！

下一篇：最后一页

投资

精彩推送

Stability AI新文本到图像模型DeepFloyd IF 拥有深度文本理解能力 当前快讯

当前短讯！格力电器被折价抛售35亿，机构接盘30亿，谁在狂卖？

热门看点：证监会就个人养老金投资公募基金规则征求意见 资本市场将迎新型长期投资者

世界视讯！荣盛发展(002146)拟收购荣盛兴城剩余15%股权 其为产业新城业务投资和运营平台

热文：万达电影公告：股东可以1元价格获得观影券礼包一份

世界消息！恒生科技指数收盘涨超4%，医药、汽车股表现强势

焦点简讯:速览 Optimism 治理基金 3600 万枚 OP 分配方式

孟和-世界新视野

今日热闻!现货黄金本周成交金额达7.51亿

沙雕时间|敲传统木鱼见如来佛祖，敲电子木鱼见初音未来

轻奢耐用、颜值高的INCASE City 商务通勤包使用体验

拱墅：“洋社工”与居民“斗蛋” 最新快讯

焦点快看：长沙白癜风治疗,白癜风怎么治会好的快一点?

安奈儿：公司电子束接枝抗病毒抗菌面料实现量产，首款产品“安心衣”已入市-天天看热讯

信用卡要怎么样申请停息挂账？信用卡停息挂账条件是什么？-环球时讯

今日讯！三百万人民币重多少斤

全球观热点：中牟县狼城岗镇：“一站三延”助力“四治一创”走深走实

天天观天下！往期回顾：泽连斯基访问荷兰 欧盟高官警告俄勿借克宫遇袭升级战事

全球首例非人灵长类动物介入式脑机接口试验取得成功，我国脑机接口技术再获突破！

每日信息：近18亿资金集结，主力爆买这只半导体新股！

俄称多方向对乌发动攻势，乌称击退俄军进攻

Faker：目前还没有特别想碰到的队伍，今年MSI赛制感觉很有意思

土建类专业包括哪些专业_土建类包括什么专业 全球时快讯

当前观察：湖南省湘西土家族苗族自治州花垣县2023-05-06 02:20发布暴雨黄色预警

高跟鞋配超短裙，魔术师变性儿子罕见现身！大秀豪车遭摄影师偷拍

【世界新视野】假期后上班，来份超级精力汤让自己能量满满

环球快报:小小鲜切花托起乡村振兴大产业

盛路通信：布局6G技术研发工作，相关毫米波技术已申请专利

清明节放假几天法定节假日_清明节法定节日介绍 世界头条

多家机构：不再与编剧史航合作_热推荐

环球播报:水晶光电获得海外HUD项目定点通知书

“华龙一号”全球首堆示范工程通过竣工验收 世界今热点

海东市纪委监委：一以贯之严查违规吃喝问题

招商蛇口董秘余志良辞任 财务总监黄均隆接任

速看：mac地址克隆稳定性 mac地址克隆

交投集团客运总站“五一”忙而不乱

当前视点！顺发恒业: 关于减持已回购股份的进展公告

记录刷新！深圳地铁这3条线人最多，市民吐槽“挤到怀孕” 焦点关注

四十而不惑的意思解释_四十而不惑的意思

GPD 新款 WIN MAX 2 掌机曝光：搭载 R7 7840U

全球通讯！大失所望！深圳被淘汰，赛后谁注意到沈梓捷，表情十分复杂！

央视剧评 | 《航拍中国》第四季台湾篇：鸟瞰台湾之美 描绘两岸新篇-全球即时看

孕妇感冒嗓子痒痒怎么办_孕妇感冒嗓子痒怎么办 全球最新

全球热消息：徒步大会开始报名！操作指引来了

北京大风蓝警中！游船停驶，索道停运……别白跑

全球短讯！山东省市场监管局举办2023年食品抽检和特殊食品监管能力提升培训班

今日快讯：北京发布大风蓝色预警！四家公园游船停驶，香山索道暂停运营

微软宣布向所有用户开放新版必应 登录微软账户即可访问

加快农业“科技速度” 智慧育苗显身手

管风琴的特点（管风琴特点 庄严）

【时快讯】五菱缤果打击比亚迪术语遭曝光，实力不够术语来凑？

三部门联合开展“护松2023”行动 打击涉松材线虫病疫木违法犯罪行为

如何购买和使用质量好的保温杯？

且试天下小说结局谁得了天下？且试天下小说结局大哥是好是坏？

天天热点评！马尾建设水产品餐饮集中地 青洲渔人广场拟年内开业

文明实践在行动｜守护文明风景线-独家

中央气象台继续发布强对流天气蓝色预警、暴雨蓝色预警 焦点播报

Stability AI新文本到图像模型DeepFloyd IF 拥有深度文本理解能力当前快讯

热门看点：证监会就个人养老金投资公募基金规则征求意见资本市场将迎新型长期投资者

世界视讯！荣盛发展(002146)拟收购荣盛兴城剩余15%股权其为产业新城业务投资和运营平台

天天观天下！往期回顾：泽连斯基访问荷兰欧盟高官警告俄勿借克宫遇袭升级战事

土建类专业包括哪些专业_土建类包括什么专业全球时快讯

清明节放假几天法定节假日_清明节法定节日介绍世界头条

“华龙一号”全球首堆示范工程通过竣工验收世界今热点

招商蛇口董秘余志良辞任财务总监黄均隆接任

央视剧评 | 《航拍中国》第四季台湾篇：鸟瞰台湾之美描绘两岸新篇-全球即时看

孕妇感冒嗓子痒痒怎么办_孕妇感冒嗓子痒怎么办全球最新

微软宣布向所有用户开放新版必应登录微软账户即可访问

管风琴的特点（管风琴特点庄严）

三部门联合开展“护松2023”行动打击涉松材线虫病疫木违法犯罪行为

天天热点评！马尾建设水产品餐饮集中地青洲渔人广场拟年内开业

中央气象台继续发布强对流天气蓝色预警、暴雨蓝色预警焦点播报