(资料图片仅供参考)
IT之家 1 月 31 日消息,快手今日宣布推出新一代视频生成模型可灵 3.0 系列,目前处于超前内测阶段。该系列包含图片 3.0、视频 3.0 和视频 3.0 Omni,在原有模型基础上进行了技术升级。
其中,图片 3.0 模型主要升级包括四项功能:
据介绍,此次升级采用视觉思维链(vCoT)技术辅助生成前的场景解构推理,并通过 Deep-Stack 视觉信息流机制增强细粒度感知能力。模型训练过程中引入强化学习框架,结合真实感与电影质感双重评估标准优化输出效果。
另外,新的视频模型采用统一的多模态训练框架,支持文本、图像、视频片段等多种输入形式,单次视频生成时长最高可达 15 秒,并支持 3-15 秒灵活时长设置。功能改进主要包括:
视频 3.0 Omni 版本额外支持创建视频主体特征库,可提取 3-8 秒视频中的角色形象与音色进行还原应用。技术文档显示,此次升级涉及多模态指令解析架构优化、音频采样区间调整及特征解耦重组方案。
天阳科技(300872):中标成方金融科技有限公司采购项目,中标金额为12
复旦大学未来信息创新学院教授张荣君团队和复旦大学附属口腔医院主任医
2026年1月26日,中石化公布己内酰胺(PA6原料)上周周结价为9760元 吨(六
1月25日晚间,中宠股份公告拟1亿至2亿元回购股份,披露公司将使用自有
人民财讯1月26日电,顺络电子(002138)近日接受机构调研时表示,公司
X 关闭
X 关闭