国内AI技术再突破:Vidu视频大模型一键生成高清内容

【HowToTech科技】4月28日消息,随着Sora在全球掀起AI视频生成热潮,国内科技界也迎来了新的突破。近日,一段由国内AI技术生成的视频短片受到了广泛关注,该视频源自生数科技与清华大学联合发布的最新视频大模型Vidu。

据官方介绍,Vidu模型采用了团队原创的Diffusion与Transformer融合的架构U-ViT,能够一键生成长达16秒、分辨率高达1080P的高清视频内容。用户只需输入简单的指令,如“画室里的一艘船驶向镜头”,Vidu便能生成效果逼真、镜头连贯的高清视频。其整体质感足以与全球领先的Sora模型相媲美。

除了能生成复杂且细节丰富的场景外,Vidu还具备虚构场景及想象超现实主义画面的能力,同时能更好地理解和生成熊猫、龙等富有中国文化特色的形象。这一创新功能的引入,使得Vidu在国内外AI视频生成领域中脱颖而出。

HowToTech科技了解到,生数科技团队在机器学习和多模态大模型领域有着深厚的积累。正是基于这些长期的技术沉淀,团队在短短两个月内便突破了长视频表示与处理的多项关键技术,成功研发并推出了Vidu视频大模型。

公开资料显示,生数科技成立于2023年3月,其核心团队来自清华大学人工智能研究院,并汇聚了来自北京大学及阿里巴巴、腾讯、字节跳动等知名科技公司的技术精英。截至2024年3月,公司员工总数已超过70人,其中研发人员占比近90%,彰显了公司强大的研发实力。

生数科技自成立以来,便致力于打造可控多模态通用大模型。去年3月,公司开源了全球首个基于U-ViT框架的多模态扩散大模型UniDiffuser,进一步巩固了其在行业内的领先地位。同时,公司在短短一年时间内完成了三轮融资,总计数亿元人民币,估值迅速攀升,已成为目前国内多模态大模型中估值最高的初创公司之一。

生数科技的快速发展和Vidu模型的成功发布,不仅展示了国内AI技术的创新实力,也为全球AI视频生成领域注入了新的活力。未来,随着技术的不断进步和应用场景的拓展,我们有理由相信AI将在视频创作领域发挥更加重要的作用。

大鱼的头像

这个人很懒,什么都没有留下~

延伸阅读:

OpenAI 测试长输出版 GPT-4o:单次输出达64K tokens

【HowToTech科技】8月1日消息,OpenAI在7月29日透露,他们正在对一款名为GPT-4o Long Outp...

大鱼的头像
大鱼
2024 年 8 月 1 日
ISC.AI2024数字安全峰会:360、华为、微软等共话安全+AI新挑战

7月31日,ISC.AI 2024数字安全峰会在北京国家会中心顺利召开。峰会以“打造安全大模型,引领安全行业革命”为主题...

大鱼的头像
大鱼
2024 年 7 月 31 日
ISC.AI2024开幕 周鸿祎发布国内首个免费安全大模型

“把大模型拉下神坛就要把免费贯彻到底,今天我在行业里第一个宣布安全大模型免费。”7月31日,ISC.AI2024第十二届...

大鱼的头像
大鱼
2024 年 7 月 31 日
阿里通义免费开放奥运AI大模型

7月31日,阿里通义宣布免费开放奥运AI大模型,具备最强奥运专业知识,并集合同声传译级别的中法互译功能。即日起,用户可以...

大鱼的头像
大鱼
2024 年 7 月 31 日
实时对话更自然,OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式

【HowToTech科技】7月31日消息,OpenAI于当地时间30日宣布,即日起GPT-4o的语音模式(注:Alpha...

大鱼的头像
大鱼
2024 年 7 月 31 日