字节跳动推出创新视频模型Boximator:文本精确控制动作
【HowToTech科技】2月20日消息,今日有传闻称,在Sora点燃文生视频领域的热潮之前,中国的科技巨头字节跳动已经悄悄推出了一款具有革新性的视频模型——Boximator。与目前市场上的Gen-2、Pink1.0等模型相比,Boximator的独特之处在于,它能够根据文本输入精确地控制生成视频中人物或物体的动作,为视频创作提供了全新的可能性。
新浪科技对这一消息进行了报道,并援引了字节跳动相关人士的回应。该人士表示,Boximator是字节跳动在视频生成领域探索控制对象运动的一项技术研究项目。然而,他也坦承,目前Boximator还无法作为一个完善的产品推向市场,与国外领先的视频生成模型相比,在画面质量、保真率以及视频时长等方面仍存在不小的差距。
据HowToTech科技了解,此前OpenAI推出的文生视频大模型Sora已经展示了其强大的能力。Sora可以根据快速的文本提示,生成“逼真”且“富有想象力”的60秒视频。更令人印象深刻的是,它还能在单个生成的视频中创建多个镜头,并准确保留角色和视觉风格。OpenAI已经宣布,将为视觉艺术家、设计师和电影制作人提供Sora的访问权限,这无疑将进一步推动视频创作领域的发展和创新。
延伸阅读:
OpenAI 测试长输出版 GPT-4o:单次输出达64K tokens
【HowToTech科技】8月1日消息,OpenAI在7月29日透露,他们正在对一款名为GPT-4o Long Outp...
ISC.AI2024数字安全峰会:360、华为、微软等共话安全+AI新挑战
7月31日,ISC.AI 2024数字安全峰会在北京国家会中心顺利召开。峰会以“打造安全大模型,引领安全行业革命”为主题...
ISC.AI2024开幕 周鸿祎发布国内首个免费安全大模型
“把大模型拉下神坛就要把免费贯彻到底,今天我在行业里第一个宣布安全大模型免费。”7月31日,ISC.AI2024第十二届...
实时对话更自然,OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式
【HowToTech科技】7月31日消息,OpenAI于当地时间30日宣布,即日起GPT-4o的语音模式(注:Alpha...