メインコンテンツへスキップ
AI HACK国内最大級の生成AIスクール・講座検索サイト
スクール一覧法人向けランキング記事スクールを探す
AI HACK

スクール

スクール一覧生成AI総合AI×動画生成無料セミナーAI×デザインAI×プログラミングAI×マーケティングAI×業務活用AI×フリーランス

AI研修

研修一覧AI研修IT研修DX研修AI×動画生成研修AI×画像生成研修DX支援補助金

コンテンツ

ランキング記事特集口コミ生成AI用語集

サイト情報

運営情報お問い合わせプライバシーポリシー利用規約口コミガイドラインサイトマップ

© 2026 AI HACK - AIスクール・AI研修の検索、比較、口コミサイト

  1. TOP
  2. /用語集
  3. /拡散モデル
画像/動画/音声生成

拡散モデルとは?

読み: かくさんモデル英語: Diffusion Model

ノイズから段階的にノイズを除去して画像・動画・音声を生成する深層生成モデル。現代の画像生成 AI の主流技術。

詳しい解説

拡散モデル (Diffusion Model) は、学習時に画像にガウシアンノイズを段階的に加えていき、生成時にはその逆過程 (ノイズ除去) を学習したニューラルネットワークで実行することで、高品質な画像・動画・音声を生成する深層生成モデルです。

2020 年代以降に DDPM・Stable Diffusion・Imagen・DALL-E 3・Flux などで実用化され、GAN や VAE を上回る品質と多様性で画像生成 AI の主流技術となりました。 動画 (Sora)、音声 (AudioLDM)、3D など他のモダリティにも応用が広がっています。

テキスト条件付きの Text-to-Image 拡散モデルでは、Text Encoder で得た埋め込みを Cross-Attention で取り込み、ノイズ除去過程に反映することでテキスト指示に沿った画像を生成します。

関連用語

Stable DiffusionStability AI が公開した拡散モデルベースの画像生成 AI。OSS として広く普及し、ローカル実行・カスタマイズが可能。SoraOpenAI が開発する動画生成 AI。テキストプロンプトから 1 分以上の高品質動画を生成でき、コンテンツ制作を変革。画像生成 AIテキスト等の指示から画像を生成する AI 技術の総称。Stable Diffusion / Midjourney / DALL-E 等が代表的。

この分野を学べる生成AIスクール

拡散モデルを含む生成AIのスキルを体系的に身につけたい方は、AI HACK のスクールランキングをご活用ください。

総合ランキングを見る →おすすめスクール19選を見る
← 用語集の一覧へ戻る