Webディレクター年収診断バナーPC

マルチモーダル生成AIの世界的企業ShengShu Technology(生数科技、CEO:駱怡航)は2月2日、AI動画生成プラットフォーム「Vidu(ヴィドゥ)」の最新モデル「Vidu Q3」を正式発表した。発表は同社主催の国際イベント「Yes Vidu Global Creativity Week」(1月30日~2月15日開催)で行われた。

Vidu Q3は、音声と映像を同時に生成する世界初の長編AI動画モデルである。最大16秒のネイティブ音声付き映像を単一パスで出力でき、撮影やアフレコの工程を省略しながら完全同期された表現を実現した。これにより、従来の静止画的な動画生成から、ストーリーテリング重視のコンテンツ制作へと進化を遂げた。

Viduシリーズの特徴は、研究成果を実用化へ迅速に結びつける「開発速度」にある。同社は清華大学との共同研究により開発した高速推論技術「TurboDiffusion」を採用。生成速度を最大200倍に高め、OpenAIやGoogleなどを含むグローバル競合との差別化を図っている。

今回の発表では、Q3に加えて参照駆動型生成モデル「Vidu Q2 Reference-to-Video Pro」や、AI動画専用制作コミュニティ「Reference Hub」も同時公開された。Vidu Q2 Proは、複数の動画・画像を参照素材として連携させることで、制御性と一貫性を高めた制作を可能にした。Reference Hubは8カテゴリ・200種以上の構造化主体を備え、プロの制作環境に近いワークフローを提供する。

さらに、一連の自動化を担う「Vidu Agent 1.0」も登場した。BGMや音声を自動同期させ、ワンクリックで動画制作を完結できる。企業のマーケティング動画や教育コンテンツの迅速な内製化に貢献するという。

性能面でもViduは高く評価されている。AI分析機関Artificial Analysisによる最新ランキングで、Vidu Q3 ProはELOスコア1,241を獲得し、世界第2位にランクインした。RunwayやGoogle、OpenAIの主要モデルを上回り、トップクラスの生成品質を示している。

ShengShu Technologyは2023年に北京で設立されたAIスタートアップで、清華大学出身の研究者らが中心となっている。現在、200以上の国と地域でサービスを展開し、登録クリエイターは4,000万人を超える。生成された動画は累計5億本以上にのぼり、商業利用が7割を占める。

日本国内でも動画配信市場が拡大する中、撮影・編集・音声収録などの制作負担が課題となっていた。Viduは音声と映像を統合的に生成することで、この課題に対する解決策を提示する。提供は1月30日から順次開始され、無料試用プランと複数の有料プランが用意されている。

マネジメント力チェック