国内AI技术再突破:Vidu视频大模型一键生成高清内容
【HowToTech科技】4月28日消息,随着Sora在全球掀起AI视频生成热潮,国内科技界也迎来了新的突破。近日,一段由国内AI技术生成的视频短片受到了广泛关注,该视频源自生数科技与清华大学联合发布的最新视频大模型Vidu。
据官方介绍,Vidu模型采用了团队原创的Diffusion与Transformer融合的架构U-ViT,能够一键生成长达16秒、分辨率高达1080P的高清视频内容。用户只需输入简单的指令,如“画室里的一艘船驶向镜头”,Vidu便能生成效果逼真、镜头连贯的高清视频。其整体质感足以与全球领先的Sora模型相媲美。
除了能生成复杂且细节丰富的场景外,Vidu还具备虚构场景及想象超现实主义画面的能力,同时能更好地理解和生成熊猫、龙等富有中国文化特色的形象。这一创新功能的引入,使得Vidu在国内外AI视频生成领域中脱颖而出。
HowToTech科技了解到,生数科技团队在机器学习和多模态大模型领域有着深厚的积累。正是基于这些长期的技术沉淀,团队在短短两个月内便突破了长视频表示与处理的多项关键技术,成功研发并推出了Vidu视频大模型。
公开资料显示,生数科技成立于2023年3月,其核心团队来自清华大学人工智能研究院,并汇聚了来自北京大学及阿里巴巴、腾讯、字节跳动等知名科技公司的技术精英。截至2024年3月,公司员工总数已超过70人,其中研发人员占比近90%,彰显了公司强大的研发实力。
生数科技自成立以来,便致力于打造可控多模态通用大模型。去年3月,公司开源了全球首个基于U-ViT框架的多模态扩散大模型UniDiffuser,进一步巩固了其在行业内的领先地位。同时,公司在短短一年时间内完成了三轮融资,总计数亿元人民币,估值迅速攀升,已成为目前国内多模态大模型中估值最高的初创公司之一。
生数科技的快速发展和Vidu模型的成功发布,不仅展示了国内AI技术的创新实力,也为全球AI视频生成领域注入了新的活力。未来,随着技术的不断进步和应用场景的拓展,我们有理由相信AI将在视频创作领域发挥更加重要的作用。
延伸阅读:
OpenAI 测试长输出版 GPT-4o:单次输出达64K tokens
【HowToTech科技】8月1日消息,OpenAI在7月29日透露,他们正在对一款名为GPT-4o Long Outp...
ISC.AI2024数字安全峰会:360、华为、微软等共话安全+AI新挑战
7月31日,ISC.AI 2024数字安全峰会在北京国家会中心顺利召开。峰会以“打造安全大模型,引领安全行业革命”为主题...
ISC.AI2024开幕 周鸿祎发布国内首个免费安全大模型
“把大模型拉下神坛就要把免费贯彻到底,今天我在行业里第一个宣布安全大模型免费。”7月31日,ISC.AI2024第十二届...
实时对话更自然,OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式
【HowToTech科技】7月31日消息,OpenAI于当地时间30日宣布,即日起GPT-4o的语音模式(注:Alpha...