当前位置:首页 > 精选

生数科技发布多模态高可控视频生成模型

2025-03-30 01:51 来源:新华网-北京

3月29日,中关村论坛人工智能日的主题演讲上,清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军发布多模态视频生成模型Vidu Q1。该模型聚焦“高可控”,力求解决当前AI视频生成过程“随机性”的痛点。该模型于4月全球上线。

一直以来,AI视频生成过程中的“随机性”是老大难问题。Vidu Q1针对AI视频随机生成的痛点,引入多元素控制,聚焦“可控性”的提升,使AI视频生成的技术迭代满足当前视频制作精品化精细化的趋势。

Vidu Q1在多主体细节可控、音效同步可控、画质增强等方面突破显著。

以多主体细节可控为例,在语义指令的基础上,通过融入参考图的视觉指令,Vidu Q1支持对场景中多主体的位置、大小、运动轨迹等属性进行更进一步控制,对所有动作行为进行精准调整。

音效同步可控功能确保了随视频环境与画面转场Vidu Q1能够输出生成相应音效,并可精准控制每段音效的长短区间、精准设置每段音频出现的时间点。如0-2s的风声、3-5s的雨声等。Vidu Q1在节省时间的同时,能显著增强视频的沉浸感与感染力。

此外,Vidu Q1还能进一步增强画质,为用户带去更加清晰、细腻、逼真的视觉体验。

2024年4月,在中关村论坛未来人工智能先锋论坛上,生数科技联合清华大学正式发布了视频大模型Vidu,引发业内关注。

免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。

相关文章

  • 试驾丨大众途锐“全能”所换来的出行自信
    试驾丨大众途锐“全能”所换来的出行自信

    如果用拟人的手法去形容大众途锐这款车,刚毅的性格和硬汉的形象无疑是它留给车迷们的深刻印象。这不仅归因于其名字由来于有“沙漠骑士”之称的图瓦雷克民族,更因为PL71平台的第一代大众途锐强大的越野能力,这为之后的途锐车型树立了坚实的榜样基础。如...

  • 比亚迪元PLUS冠军版:加量还降价
    比亚迪元PLUS冠军版:加量还降价

    视频无法播放,请升级浏览器至最新版。上市19个月就迎来第50万台新车下线、销售市场遍布全球58个国家的比亚迪元PLUS,近日也正式推出了“加量还降价”的元PLUS冠军版车型。新车共推出五款车型,官方指导价13.58-16.38万元。起步价从...

  • 小米汽车新专利公布:可根据用车习惯提前唤醒车辆
    小米汽车新专利公布:可根据用车习惯提前唤

    小米汽车表示,目前,一些车辆已经支持远程控制。例如,用户可以通过手机远程控制车辆开启空调、解锁闭锁等。但在一些场景中,对于用户的操作请求,车辆的响应时长较长,降低了用户的体验。而小米汽车近期公开的专利将允许车辆获取用户用车记录,并根据记录从...

  • 福特汽车与加拿大工会达成初步协议,避免了罢工
    福特汽车与加拿大工会达成初步协议,避免了

    盖世汽车讯据路透社报道,当地时间9月19日晚些时候,福特汽车与加拿大工会达成初步协议,进而避免了罢工。工会在一份声明中谈到初步协议时表示,“我们动用了工会最有力的武器:罢工权。这些成果是经过数周的艰苦谈判才取得的。”福特加拿大分公司在一份声...

  • 中国汽研联合中检欧洲公司成立中国汽车欧洲中心
    中国汽研联合中检欧洲公司成立中国汽车欧洲

    9月18日,“中国汽车工业协会巴塞罗那信息服务中心暨中国中检-中国汽车欧洲中心”成立及揭牌仪式在西班牙巴塞罗那主会场及中国北京分会场举行。中国驻巴塞罗那总领事馆、加泰罗尼亚政府贸易投资局、巴塞罗那市政府经济推广署、中国汽车工业协会、中国中检...