Limited Time Sale: Get 30% OFF on Next-Gen AI Video Creation

Wan 2.2

Alibaba製

创作のハードルを下げ、Wan 2.2人工知能であなたのクリエイティビティを力強くサポートする革命的なAIクリエイティブプラットフォーム。テキストから画像へ、画像から動画へ、Wan 2.2は包括的なAIクリエイティブ体験を提供します。

Wan 2.2のコア能力

Alibabaの高度なWan 2.2人工知能技術をベースに、包括的なクリエイティブソリューションを提供

Wan 2.2を使用してテキスト説明を入力すると、AIが高品質な画像作品を生成し、様々な芸術スタイルとテーマのクリエイティブをサポートします。Wan 2.2の高度な拡散モデルを通じて、複雑な意味情報を理解し、説明に合致する美しい画像を生成できます。

Wan 2.2は静的な画像をダイナミックな動画に変換し、あなたのクリエイティブ作品に生き生きとした視覚効果を追加します。Wan 2.2の強力な時空一貫性アルゴリズムをベースに、生成された動画が自然で滑らかでありながら、コア画像の特徴を維持することを保証します。

Wan 2.2のワンクリックスタイル変換で、写真から手描きへ、写実からアニメへ、異なるクリエイティブなニーズを満たします。Wan 2.2は様々な芸術スタイル変換をサポートし、あなたの作品に独特の視覚効果を与えます。

私たちは、視覚生成モデルの主要なアップグレードであるWan2.2を紹介できることを嬉しく思います。現在オープンソース化され、より強力な機能、より優れたパフォーマンス、より優れた視覚品質を提供しています。

アーキテクチャ
MoEアーキテクチャ
Wan2.2は動画拡散モデルにミックスチャー・オブ・エキスパーツ（MoE）アーキテクチャを導入しました。特化した強力なエキスパートモデルで時間ステップを越えてデノイジングプロセスを分離することで、同じ計算コストを維持しながら、全体のモデル容量を拡大します。
スケーリング
データスケーリング
Wan2.1と比較して、Wan2.2はさらに大きなデータで訓練され、画像を+65.6%、動画を+83.2%增やしました。この拡張は、動き、意味論、美学などの複数の次元でモデルの汎化能力を著しく向上させました。
美学
映画的美学
Wan2.2は照明、構図、色彩の細かいラベルで特別に精選された美的データを組み込んでいます。これにより、より精密で制御可能な映画スタイル生成が可能になります。
効率性
効率的な高解像度ハイブリッドTI2V
Wan2.2は、高度なWan2.2-VAEで構築された5Bモデルをオープンソース化し、16×16×4の圧縮率を実現しています。このモデルは24fpsの720P解像度でテキストto動画と画像to動画生成の両方をサポートしています。