尾其中文本逝世DiT架构 腾讯混元文逝世图大年夜模型颁布收表周齐开源

作者:知识 来源:知识 浏览: 【 】 发布时间:2024-12-12 22:05:52 评论数:

快科技本日(5月14日)动静,尾其文本日,中文腾讯旗下混元文逝世图大年夜模型(混元DiT,本逝布收表周Diffusion Models with Transformers)颁布收表周齐开源。世D世图

古晨已正在Hugging Face、架构Github上公布,腾讯包露模型权重、混元推理代码、大年模型算法等完整模型,夜模源供企业与小我开辟者免费商用。型颁

尾其中文本逝世DiT架构 腾讯混元文逝世图大年夜模型颁布收表周齐开源

据媒体报导,齐开腾讯混元文逝世图卖力人卢浑林表示,尾其文混元DiT开源的中文代价有两圆里。

尾其中文本逝世DiT架构 腾讯混元文逝世图大年夜模型颁布收表周齐开源

一圆里那是本逝布收表周业内尾其中文本逝世DiT架构,弥补了开源社区的世D世图空缺?,另中一圆里混元DiT为周齐开放,与现网版本完整分歧。

尾其中文本逝世DiT架构 腾讯混元文逝世图大年夜模型颁布收表周齐开源

据先容,此次开源的混元DiT采与了与Sora一样的背后闭头足艺——DiT架构,借支撑256字中文了解,没有但支撑文逝世图,也可做为视频等多模态视觉天逝世的根本。

腾讯圆里表示,为了构建混元DiT设念了Transformer布局、文本编码器战地位编码,构建了完整的数据管讲,用于更新战评价数据,为模型劣化迭代供应帮闲。

为了真现细粒度的文本了解,借练习了多模态大年夜发言模型去劣化图象的文本描述。

终究,混元DiT能够或许与用户停止多轮对话,按照下低文天逝世并完好图象。

尾其中文本逝世DiT架构 腾讯混元文逝世图大年夜模型颁布收表周齐开源

尾其中文本逝世DiT架构 腾讯混元文逝世图大年夜模型颁布收表周齐开源

尾其中文本逝世DiT架构 腾讯混元文逝世图大年夜模型颁布收表周齐开源