- OpenAI は、単純なテキスト プロンプトから詳細なビデオを生成し、既存のビデオを継続し、静止画像に基づいてシーンを作成する、テキストからビデオへのモデルである Sora を発表しました。

- Sora は、前モデルの DALL-E 3 と同様の「拡散」モデルに基づいており、複数のキャラクター、特定のモーション タイプ、正確な詳細を備えた最大 1080p の解像度で映画のようなシーンを作成できます。

- ソラには、正確な物理シミュレーションに苦労し、因果関係や空間の詳細に問題を引き起こすなどの弱点があることが認識されています。

- このモデルは現在、サイバーセキュリティ評価の「レッド チーム担当者」と、フィードバックを収集するために選ばれたデザイナー、ビジュアル アーティスト、映画製作者に利用可能です。

- OpenAI CEO の Sam Altman 氏は、X でのカスタム ビデオ生成リクエストに積極的に応じ、Sora が生成した 7 つのビデオを共有し、ユーザーから肯定的な反応を得ました。

- 賞賛にもかかわらず、特に違法な素材を使用してトレーニングされた AI 画像生成ツールの暴露後、倫理的影響についての懸念が生じています。

- Nvidia の上級研究員 Jim Fan 氏は、Sora はシーン内のオブジェクトの物理を決定論的に作成するため、単純なクリエイティブ ツールではなく「データ駆動型の物理エンジン」であると説明しています。

#OpenAI #OpenAI's #SORA