体育游戏app平台
3月6日,腾讯混元发布图生视频模子并对外开源,同期上线对口型与四肢启动等玩法,并撑抓生成布景音效及2K高质料视频。
基于图生视频的智商,用户只需上传一张图片,并随意形容但愿画面如何绽开、镜头如何救助等,混元即可按照用户要求让图片动起来,形成5秒的短视频,还能自动配上顺应的布景音效。此外,上传一张东说念主物图片,并输入但愿“对口型”的笔墨或音频,图片中的东说念主物即可“话语”或“唱歌”;要是承袭四肢模版,还能一键生成同款舞蹈视频。当今用户通过混元AI视频官网(https://video.hunyuan.tencent.com/)即可体验,企业和缔造者可在腾讯云苦求使用API接口使用。
这次开源的图生视频模子,是混元文生视频模子开源职责的不时,模子总参数目保抓 130 亿,适用于多种类型的变装和场景,包括写实视频制作、动漫变装以至CGI变装制作的生成。开源本色包含权重、推理代码和LoRA实际代码,撑抓缔造者基于混元实际专属LoRA等养殖模子。当今在Github、HuggingFace等主流缔造者社区均可下载体验。
据混元开源时代呈文袒露,混元视频生成模子具备纯确切膨胀性,图生视频和文生视频在酌量的数据集上开展预实际职责。在保抓超写实画质、畅通演绎大幅度四肢、原生镜头切换等特色的基础上,让模子简略捕捉到丰富的视觉和语义信息,并消灭图像、文本、音频和姿态等多种输入条款,杀青对生成视频的多维度死心。
混元视频生成模子开源以来,一直保抓较高的热度,前年12 月登顶huggingface全站趋榜第一,当今Github平台上Star数朝上8.9K。多位缔造者自觉制作基于社区Hunyuanvideo的插件与养殖模子,蕴蓄朝上 900 个养殖版块。更早开源的混元DiT文生图模子,在国表里养殖模子数目多达1600多个。
当今,混元开源系列模子一经圆善袒护文本、图像、视频和3D生成等多个模态,在Github 累计得到超 2.3 万缔造者关爱和star。
雅菲 小风
校对 陶善工体育游戏app平台