业界动态
腾讯宣布混元文生图大模型开源: Sora 同架构,可免费商用
2024-05-26 07:00

5月14日,腾讯宣布旗下的混元文生图大模型全面升级并对外开源,目前已在 Hugging Face 平台及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。

这是业内首个中文原生的DiT架构文生图开源模型,支持中英文双语输入及理解,参数量15亿。升级后的混元文生图大模型采用了与 sora 一致的DiT架构,不仅可支持文生图,也可作为视频等多模态视觉生成的基础。

评测数据显示,最新的腾讯混元文生图模型效果远超开源的 Stable Diffusion 模型,是目前效果最好的开源文生图模型;整体能力属于国际领先水平。

大模型的优异表现,离不开领先的技术架构。升级后的腾讯混元文生图大模型采用了全新的DiT架构(DiT,即Diffusion With Transformer),这也是Sora和 Stable Diffusion 3 的同款架构和关键技术,是一种基于Transformer架构的扩散模型。

过去,视觉生成扩散模型主要基于 U-Net 架构,但随着参数量的提升,基于 Transformer 架构的扩散模型展现出了更好的扩展性,有助于进一步提升模型的生成质量及效率。腾讯混元是业界最早探索并应用大语言模型结合 DiT 结构的文生图模型之一。从 2023 年 7 月起,腾讯混元文生图团队就明确了基于DiT架构的模型方向,并启动了新一代模型研发。今年初,混元文生图大模型已全面升级为DiT架构。

在DiT架构之上,腾讯混元团队在算法层面优化了模型的长文本理解能力,能够支持最多 256 字符的内容输入,达到行业领先水平。同时,在算法层面创新实现了多轮生图和对话能力,可实现在一张初始生成图片的基础上,通过自然语言描述进行调整,从而达到更满意的效果。

中文原生也是腾讯混元文生图大模型的一大亮点,此前,像 Stable Diffusion 等主流开源模型核心数据集以英文为主,对中国的语言、美食、文化、习俗都理解不够。混元文生图是首个中文原生的DiT模型,具备中英文双语理解及生成能力,在古诗词、俚语、传统建筑、中华美食等中国元素的生成上表现出色。

评测结果显示,新一代腾讯混元文生图大模型视觉生成整体效果,相比前代提升超过 20%,在语义理解、画面质感与真实性方面全面提升,在多轮对话、多主体、中国元素、真实人像生成等场景下效果提升显著。

腾讯混元文生图能力,已经广泛被用于素材创作、商品合成、游戏出图等多项业务及场景中。今年初,腾讯广告基于腾讯混元大模型,发布了一站式 AI 广告创意平台腾讯广告妙思,可为广告主提供文生图、图生图、商品背景合成等多场景创意工具,有效提高了广告生产及投放效率。《央视新闻》《新华日报》《深圳特区报》《南方都市报》《羊城晚报》等20余家媒体,也已经将腾讯混元文生图用于新闻内容生产。

腾讯文生图负责人芦清林表示:“腾讯混元文生图的研发思路就是实用,坚持从实践中来,到实践中去。此次把最新一代模型完整开源出来,是希望与行业共享腾讯在文生图领域的实践经验和研究成果,丰富中文文生图开源生态,共建下一代视觉生成开源生态,推动大模型行业加速发展。”

基于腾讯此次开源的文生图模型,开发者及企业无需重头训练,即可直接用于推理,并可基于混元文生图打造专属的AI绘画应用及服务,能够节约大量人力及算力。透明公开的算法,也让模型的安全性和可靠性得到保障。

同时,基于开放、前沿的混元文生图基础模型,也有利于在以 Stable Diffusion 等为主的英文开源社区之外,丰富以中文为主的文生图开源生态,形成更多样的原生插件,推动中文文生图技术研发和应用。

据了解,腾讯在开源上一直持开放态度,已开源了超 170 个优质项目,均来源于腾讯真实业务场景,覆盖微信、腾讯云、腾讯游戏、腾讯AI、腾讯安全等核心业务板块,目前在Github上已累计获得超 47 万开发者关注及点赞。

    以上就是本篇文章【腾讯宣布混元文生图大模型开源: Sora 同架构,可免费商用】的全部内容了,欢迎阅览 ! 文章地址:http://www.glev.cn/news/6121.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 歌乐夫移动站 http://www.glev.cn/mobile/ , 查看更多   
最新新闻
“未来教师实践能力:理论、政策与培养路径”研讨会成功举行
“未来教师实践能力:理论、政策与培养路径”研讨会成功举行6月14日,由中国学位与研究生教育学会教育专业学位工作委员会主办,
重回7元时代!今晚国内油价下调:加满一箱少花7.5元
6月13日消息,国家发改委官网显示,自2024年6月13日24时起,国内汽、柴油价格每吨分别降低190元、180元。机构测算,此次调价折合
AI画连环画角色更一致了!人物之间的复杂互动也能处理|中山大学&联想团队出品
声明:本文来自于微信公众号 量子位(ID:QbitAI),授权转载发布。让AI画漫画角色保持一致的新研究来了!创作的连环画效果belike:
装上心脏支架后,还能活多少年?医生不再隐瞒,说出答案
导语:宋大爷,年届六旬有六,岁月已在他脸上刻下了痕迹,但他那坚韧的性格却未曾改变。多年来,高血压一直是他生活中的一位“常
360新品发布会“被盗图人”喊话周鸿祎:要求公开道歉 赔偿1元RMB
6月13日消息,360AI新品发布会被盗图人”DynamicWangs发微博喊话周鸿祎,要求公开道歉,赔偿1元RMB。DynamicWangs发微博称:周鸿
中国移动上线骚扰电话亲情防护功能:一人拉黑 全家屏蔽
6月15日消息,当今社会,诈骗套路层出不穷,老年人常常成为诈骗分子的下手对象。尤其是如今很多年轻人在外打拼,父母老人不在身
暂只能合作4家!余承东:华为智选车30万以下都亏损 不为降成本降低产品质量
6月14日消息,今天2024中国汽车蓝皮书论坛开幕,余承东也是进行了主题演讲。余承东表示:想合作的厂家很多,但精力有限,暂时只
【中心动态】2024黄浦区健康卫生系统青年干部培训班学习体会
2024黄浦区健康卫生系统青年干部培训班学习体会为期两周的黄浦区卫生健康系统青年干部培训班已经结束,能参加此次培训我深感荣幸
华为最强智驾来了!ADS 2.0到ADS 3.0不需要更换硬件 原车就能升级
6月16日消息,近日举办的第十六届中国汽车蓝皮书论坛上,华为智能汽车解决方案BU CEO靳玉志表示,华为乾崑ADS 2.0到ADS 3.0不需
丁克15年我怀孕,妈妈联袂嫂子劝我打掉,我中断8千补贴得罪娘家
在那个空气中都凝固着静谧午后,李晓芳坐在客厅的沙发上,深呼吸着窗外微凉的春日新风。旁边的茶几上放着一副两人份的碧绿茶水,
本企业新闻