CogVideo – 文字生成影片開源模型

657次閱讀

CogVideo（文字生成影片開源模型）簡介

CogVideo 是一個文字生成影片開源模型，由清華大學訊飛聯合實驗室推出。該專案目前開源了兩個影片生成模型：CogVideo(ICLR 2023) 和 CogVideoX 系列。該模型能夠根據文字輸入生成相對高幀率的影片。

CogVideo 是首個開源的預訓練文字到影片生成模型，能夠根據文字輸入生成相對高幀率的影片。

CogVideoX 則是 CogVideo 的升級版本，是清華訊飛實驗室在 2024 年開源的影片生成模型系列。目前已開源了 CogVideoX-2B 和 CogVideoX-5B 兩個模型，分別具有 20 億和 50 億參數。與 CogVideo 相比，CogVideoX 系列在生成影片品質和視覺效果方面有了大幅提升。

CogVideoX 系列在模型架構、訓練策略等多方面進行了創新，例如採用了 Diffusion Model、3D Casual VAE 等先進技術。該系列模型支援量化推理，能在較低算力設備上運行，且支援英語輸入和長文本輸入。

CogVideo - 文字生成影片開源模型

CogVideo（文字生成影片開源模型）官網

開源地址：https://github.com/THUDM/CogVideo
線上體驗地址 1：https://huggingface.co/spaces/THUDM/CogVideoX-5B-Space
線上體驗地址 2：https://modelscope.cn/studios/ZhipuAI/CogVideoX-5b-demo

提供了線上 Demo，打開線上 Demo 後可以輸入中文描述，體驗文字到影片生成效果。

正文完

AI 文字生成影片

发表至：新聞熱話

2024-09-07

0

iOS 18.2 測試版中有望加入 AI 圖像新功能「Image Playground」和「Genmoji」

首款iOS上的3DS模擬器Folium現已上架蘋果App Store

蘋果推出 iPhone 16 系列自助維修零件服務

三星智慧型手機銷量領先蘋果，但蘋果旗艦機型佔比更高

蘋果Siri智能升級版及Apple Intelligence將於2025年春季推出

iOS 18可讓第三方App拍攝3D空間視頻，至少需iPhone 15 Pro

iOS 18.2.1電池續航力測試出爐，兩款iPhone型號獲顯著提升

特斯拉公布充滿未來感的 “Robovan” 火車頭式載客運貨車

蘋果將於10月推出第7代iPad mini和第11代入門級iPad

Frigate – 本地網路攝像頭視頻錄像系統

評論（尚無留言）