从快手处,证券时报那备受瞩目的敏锐记者知晓,在12月3日这个特定日子,快手旗下的可灵AI郑重地正式推出视频生成2.6模型,此模型具备提供“音画同出”这般独特能力,它改变了传统AI视频生成模型那种先是得出无声画面、随后才进行人工配音的工作流程 。

这一次的模型,据了解,对文生音画、图生音画这两大功能进行了升级。可灵视频生成2.6模型,具备“音画同出”能力,在单次生成时,能够输出完整视频,该视频包含自然语言、动作音效以及环境氛围音。它把当下AI视频的创作工作流进行了重构,显著提升了创作效率。

通过对物理世界里声音跟动态画面进行颇具深度的语义对齐,可灵2.6这个模型在所具备的音画协同、音频质量以及语义理解那儿展现出亮眼的表现,与此同时在中文语音生成效果方面维持全球领先的态势。目前,语音有着支持生成中文和英文的能力,生成的视频长度最长能够达到10秒。

可灵AI公布了好多段视频哇,那些视频涉及赛事解说这个场景,还涉及多人对白的场景呢,也涉及音乐表演等好些不同的场景哟,并且视频里面的声音和画面都是自然的呀,都是同步的呀,还都是流畅的呢。

诞生以来,快手可灵AI屡次历经重要更新迭代,今年9月底,可灵亮相2.5 Turbo模型,于文本响应、动态效果、风格保持、美学质量等众多维度达成提升 。

伴随着持续不断地迭代升级,可灵AI当前已然在视频生成领域占据了关键的“生态位”,在视频生成这个领域占据了重要的“生态位”。可灵AI于商业化营收方面也持续不断地收获突破,依据快手所公布的数据显示,有望在2025年的时候可灵AI的全年收入能够抵达1.4亿美元,这大约等同于10亿元人民币,相较于年初所制定的6000万美元,也就是大约4.3亿元人民币的目标提高了超出100% 。

快手怎么看同校_可灵AI视频生成2.6模型技术升级_快手可灵AI音画同出模型

在快手2025年举行的不久前的第三季度业绩电话会上,快手科技创始人兼程一笑作为首席执行官表示, 可灵呈现出非常清晰愿景,也就是“让每个人都能用AI讲出好故事”,公司会聚焦于核心目标是AI影视创作,聚合资源去深入打磨技术以及产品能力 。

在具体的迭代方向当中,可灵会围绕着技术的领先性以及产品的想象力这两条线来进行推进,围绕着多模态交互理念,像是MVL这样,结合对于用户需求的洞察,还有技术的突破,持续去升级基础模型以及产品的能力。

此外,就投资者都普遍关注的,有关AI的Capex投入跟利润率目标这一问题来说,快手科技的首席财务官金秉宣称,在今年的第三季度时,公司于探索AI技术,还有探索跟内外部应用场景彼此结合这方面,成功取得了不错之进展,AI在为业务赋予能量的同时,还在内部组织基建这块实现了质效的提升。

在可灵收入呈现增长态势,且AI业务整体发展超出预期这样的背景状况之下,金秉予以表明,公司始终持续不断地追加算力方面的投入。鉴于用户对于视频生成模型的需求一直持续增强,快手已经多次进行扩充可灵在推理侧的算力这一举措;与此同时,随着模型加速进行迭代,公司也开始着手提升训练算力,以此来保持可灵在技术层面的前沿性以及竞争力。

金秉讲了,除去可灵自身之外,快手于别的AI业务赋予能量的层面同样一块儿增添了相关的资本花销。总的来瞧,公司预估在2025年时集团整体的Capex开支会相比去年达成中高双位数的提升。

直播带货培训