4月27日,2024中关村论坛年会上首次发布我国自研的具“长时长、高一致性、高动态性”特点的文生视频大模型Vidu。这一视频大模型由清华大学联合北京生数科技有限公司共同研发,可根据文本描述直接生成长达16秒、分辨率高达1080P的高清视频内容。
Vidu, a text-to-video large AI model capable of creating a 16-second, high-definition video in 1080p resolution with a single click, was unveiled on April 27 at the 2024 Zhongguancun Forum. Developed by Tsinghua University and Chinese AI firm ShengShu Technology, Vidu is China's first video large AI model with "extended duration, exceptional consistency and dynamic capabilities".
【知识点】
Vidu是自Sora发布之后全球率先取得重大突破的视频大模型。与Sora一致,Vidu能够根据提供的文本描述直接生成长达16秒的高质量视频。除了在时长方面的突破外,Vidu在视频效果方面实现显著提升,主要体现在模拟真实物理世界、多镜头语言、时空一致性高、理解中国元素等方面。
在动态性方面,Vidu能生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头,而是能在一段画面里实现远景、近景、中景、特写等不同镜头的切换,包括能直接生成长镜头、追焦、转场等效果。
【函电贺词】
当前,互联网、大数据、云计算、人工智能、区块链等新技术深刻演变,产业数字化、智能化、绿色化转型不断加速,智能产业、数字经济蓬勃发展,极大改变全球要素资源配置方式、产业发展模式和人民生活方式。
New technologies such as the internet, big data, cloud computing, artificial intelligence and blockchain are undergoing profound changes; the digitalized, intelligent and green transformation of industries are accelerating; and the intelligent industry and digital economy are thriving. These have greatly changed the global allocation of factors and resources, industrial development models, and people's lifestyles.
——2023年9月4日,习近平致2023中国国际智能产业博览会的贺信
【相关词汇】
智能产业
intelligent industry
算力
computing power
中国日报网英语点津工作室(本文于“学习强国”学习平台首发)