国内AI技术再突破：Vidu视频大模型一键生成高清内容

【HowToTech科技】4月28日消息，随着Sora在全球掀起AI视频生成热潮，国内科技界也迎来了新的突破。近日，一段由国内AI技术生成的视频短片受到了广泛关注，该视频源自生数科技与清华大学联合发布的最新视频大模型Vidu。

据官方介绍，Vidu模型采用了团队原创的Diffusion与Transformer融合的架构U-ViT，能够一键生成长达16秒、分辨率高达1080P的高清视频内容。用户只需输入简单的指令，如“画室里的一艘船驶向镜头”，Vidu便能生成效果逼真、镜头连贯的高清视频。其整体质感足以与全球领先的Sora模型相媲美。

除了能生成复杂且细节丰富的场景外，Vidu还具备虚构场景及想象超现实主义画面的能力，同时能更好地理解和生成熊猫、龙等富有中国文化特色的形象。这一创新功能的引入，使得Vidu在国内外AI视频生成领域中脱颖而出。

HowToTech科技了解到，生数科技团队在机器学习和多模态大模型领域有着深厚的积累。正是基于这些长期的技术沉淀，团队在短短两个月内便突破了长视频表示与处理的多项关键技术，成功研发并推出了Vidu视频大模型。

公开资料显示，生数科技成立于2023年3月，其核心团队来自清华大学人工智能研究院，并汇聚了来自北京大学及阿里巴巴、腾讯、字节跳动等知名科技公司的技术精英。截至2024年3月，公司员工总数已超过70人，其中研发人员占比近90%，彰显了公司强大的研发实力。

生数科技自成立以来，便致力于打造可控多模态通用大模型。去年3月，公司开源了全球首个基于U-ViT框架的多模态扩散大模型UniDiffuser，进一步巩固了其在行业内的领先地位。同时，公司在短短一年时间内完成了三轮融资，总计数亿元人民币，估值迅速攀升，已成为目前国内多模态大模型中估值最高的初创公司之一。

生数科技的快速发展和Vidu模型的成功发布，不仅展示了国内AI技术的创新实力，也为全球AI视频生成领域注入了新的活力。未来，随着技术的不断进步和应用场景的拓展，我们有理由相信AI将在视频创作领域发挥更加重要的作用。