AI画像生成の基礎知識

2025年8月14日

AI画像生成の基礎編

この記事では、美麗な画像を生成したい私がStable DiffusionやSeaArt系のAI画像生成サービスを使い始めたい方向けに、「Text to Image」と「Image to Image」の基礎、そしてモデル・プロンプト・パラメータといった重要な用語をメモ感覚で解説します。

最近では多くのAI画像生成サービスが登場していますが、その基本的な生成方法は大きく分けて以下の2種類です。

プロンプト（指示文）を入力して、それに沿った画像を生成する方法です。
ただし細かい指定をしないと思い通りのものは作ってくれないので注意です。
例：「海岸に佇みワンピースを着ている可愛い女性の画像を生成して。」など、文章生成AIに慣れている方には直感的かもしれません。

出展：ChatGPTのイメージ生成

既存の画像とプロンプト（指示文）を組み合わせて、元画像を参考に新しい画像を生成する方法です。
元画像の構図や雰囲気を活かしつつ、テキストの指示で生成される画像の変更や追加ができます。

高品質なAI画像を作るには、プロンプト（指示文）以外にも大事な要素があります。
基本の流れは以下の通りです。

ここからは、この3つの重要要素について解説します。

AIが画像を生成するための「設計図」や「ルール」のようなものです。
どんな画像をどんな画風でどんな絵柄のクセで作るかを決める中核部分となり、モデルによって得意なテイストや描写の傾向が異なります。

生成したい画像の内容を指定する指示文です。
肯定的なプロンプト（含めたい要素）と、否定的なプロンプト（除外したい要素）の両方を使い分けることで、より狙い通りの画像を作りやすくなります。

画像の特徴や品質を調整するための設定項目です。主なものは以下の通りです。

これらを理解して調整できるようになると、思い通りの画像に近づけやすくなります。

次回は「モデル」についてもう少し深く掘り下げていきます💡