aigenart.jp

最新の画像生成AIのパフォーマンスを生かすために

Pod Cast 「物理法則で現実を再構築する」

本題の前に、研究中のPBR(Physically Based Rendering)、
AI画像生成における物理原理レンダリングについて音声での解説データを公開します。

『物理法則で現実を再構築するAI 』- Deep Live – Japanese

“Simulating the Physical Universe with AI” – Deep Live – English

ここから今日の本題に入ります

前の「画像生成の完成度を高めるためのカラーコード変換ツール – その使い方」と同じく、
中級〜上級向けに「プロンプトだけでどこまで構図・照明(光の効果など)を操れるか」を中心にまとめました。

次に秒針と時計内部のムーブメントをGoogle Flowを使って動かしてみた。
それぞれが異なるスピードでかろうじて動いていますが、実際の時間の経過と秒針の動きに乖離があります。今後の課題です。

ちなみにページトップのアイキャッチ画像にあるスケルトン内部を動かそうと悪戦苦闘しましたが、結果は支離滅裂!!これは今後の夢の課題です。

PBR(Physically Based Rendering)を埋め込んだ実験用コードです。


画像生成の基本原則(これを守るだけで成功率が跳ね上がる)


1. プロンプトの順番ルール
→ 重要な構図要素は一番前に置く(品質タグの後すぐ)
masterpiece, best quality, full body, dynamic angle, from below, …

2. 重み付けを積極活用
→ (構図キーワード:1.3〜1.8) で強調
特に効きが悪い構図は最後にもう一度入れる。
low angle:1.4), … low angle shot

3. カメラ用語を混ぜる
→写真・映画用語が一番安定して効く(AIが写真学習データに強いため)

主要構図Tips・おすすめプロンプト一覧(実測で効きやすい順)

・画角・写り範囲(一番大事!)

Hires とは
低解像度で生成した画像の構図を維持しつつ、高精細にアップスケールする機能です。小さな画像で発生しやすい顔の崩れや構図の破綻を防ぎ、詳細なディテールを追加して高解像度画像を作成するために使用されます。 

主なポイント
役割: 最初の低解像度生成(512×512など)後に、その画像を基に情報を補完し、解像度を高める。
メリット: 構図崩れ(2頭身化や多頭化)を避け、目が潰れたりする問題を解消し、高画質な画像を生成できる。

使い方: txt2img画面で「Hires. fix」にチェックを入れ、Upscaler(拡大モデル)やDenoising strength(再描画の強さ)を設定する。

注意点: 通常の生成より時間がかかる。Denoising strengthを高くしすぎると元の画像から変化してしまう。 
Denoising strength(再描画の強さ)は0.5~0.7程度が推奨され、0.3以下では詳細が追加されず、1.0に近づくと元の画像と大きく異なる画像になってしまいます。

・カメラアングル(視点の高さ・角度)

プロンプト例効果・印象効きやすさ
from below, low angle, worm’s eye view見上げる・威圧感・カッコいい◎◎◎
from above, high angle, bird’s eye view見下ろす・可愛い・俯瞰◎◎◎
from side, side view, profile横顔・サイドショット
from behind, back view後ろ姿
dutch angle, tilted angle斜め構図(不安定・緊張感)○〜◎
over the shoulder肩越しショット(会話シーンに)

・ダイナミック・動きを出す構図

・dynamic angle, dramatic angle, foreshortening (ダイナミックな角度、劇的な角度、短縮法)
・action shot, mid-air, jumping pose, running towards viewer (アクションショット、空中、ジャンプポーズ、カメラに向かって走る)
・diagonal composition, asymmetrical composition (斜めの構図、非対称の構図)
・(from dynamic low angle:1.5), (intense perspective:1.3) (ダイナミックローアングル:1.5)、(強烈な遠近法:1.3)

・芸術・写真の構図法則(プロっぽく仕上げる)

・rule of thirds composition(三分割法) → 被写体を画面の1/3線上に置く
・golden ratio composition leading lines(誘導線) → 道・視線・手すりなどで視線を誘導
・symmetrical composition, centered composition (左右対称の構図、中央配置の構図)
・negative space(余白を活かしたミニマリスト構図)

・複数キャラ・レイアウト指定(上級)

・two girls, side by side, facing each other(二人の少女が並んで向き合う)
・one in foreground, another in background, depth of field (一人は前景、もう一人は背景、被写界深度)
・multiple characters, different distances, layered composition (複数の被写体、異なる距離、重層的な構図)
・subject A on left third:1.2(左三分の一に被写体A:1.2)
・subject B on right third:1.2 (右三分の一に被写体B:1.2))

注意点・上級Tips

高解像度(768px以上)だと引き構図になりやすい → close-up系はHires.fixやimg2imgで調整
ControlNet/OpenPose併用が最強だが、プロンプトだけで頑張るなら「重み1.5以上+複数回記述」が現実解
・Flux系は自然言語が強いので
「Cinematic extreme close-up of a young woman with drenched, dark hair clinging to her temples, standing resolutely in a heavy midnight downpour.
She wears delicate round wire-rimmed glasses, with crystalline water droplets beadily clinging to the glass lenses and her skin, refracting the city lights. 」
のように要点だけを伝えて結果を検討するといった手法もまた可
これで7割くらいは狙った構図に近づけます。

自然言語によるプロンプト例 – 画角、写り範囲をテーマに

光の効果をコントロールする(照明効果のプロンプトTips)

次に最新のGoogle Nano Banana 2などで照明効果を明確にコントロールするための実践Tipsをまとめます。
前の「主要構図Tips」「色変換ツール」と同じく、中級〜上級向けに「プロンプトだけで光の質・方向・ムードを操る」テクニックを中心にまとめました。照明は画像の印象を8割決める要素なので、ここを極めると一気にクオリティが跳ね上がります。

基本原則(これを守るだけで成功率が跳ね上がる)

1. 照明キーワードはプロンプトの後半〜最後の方に置く(Flux系は特に最後が効きやすい)
→ 主体・構図・スタイル → 照明 → 雰囲気 の順が鉄板
2. 重み付け必須:(cinematic lighting:1.4) や (rim lighting:1.3) で強調
3. 光源の方向・質・色温度を具体的に指定(曖昧だとランダムになりやすい)
4. 光の相互作用(影・反射・透過・ボリューム)を入れるとリアルに
5. Flux.1系は自然言語長文が強いので「光がどのように当たっているか」を描写的に書くと抜群

照明カテゴリ別・おすすめプロンプト一覧(効きやすい順)

・自然光・時間帯系(一番使いやすい・万能)

プロンプト例効果・印象重み推奨備考
golden hour, warm sunlight夕焼け・朝焼けの暖かい黄金光1.3〜1.6肌・風景が美しくなる定番
blue hour, cool twilight夕暮れ後の青みがかった神秘光1.3〜幻想的・クール系に
midday sun, harsh sunlight真昼の強い直射日光・硬い影コントラスト強め
dappled sunlight, god rays木漏れ日・光芒(crepuscular rays)1.2〜1.5森・室内窓辺に最高
soft diffused daylight曇天・柔らかい自然光ポートレート向き

・人工照明・スタジオ系(プロ写真風に)

1. studio lighting, softbox lighting, three-point lighting
2. rim lighting, backlight, silhouette glow
3. dramatic lighting, chiaroscuro, low key lighting
4. high key lighting, flat lighting, even illumination
5. loop lighting, Rembrandt lighting, butterfly lighting(顔のライティング技法

・特殊・雰囲気重視照明(ムード爆上げ)

プロンプト例効果・印象効きやすさ
volumetric lighting, god rays光のボリューム・霧中光線◎◎◎
neon glow, cyberpunk neonネオンサインの派手な発光◎◎◎
cinematic lighting映画のようなドラマチック光◎◎
moody atmospheric lighting暗め・霧・幻想的
rim light + backlight輪郭光 + 逆光で神々しいシルエット◎◎
subsurface scattering肌・髪・布の光透過(リアル肌必須)1.2〜
glowing edges, halo lighting発光エッジ・天使の輪○〜◎

・光の方向・角度指定(上級コントロール)

・light from left, side lighting (左からの光、サイドライト)
・llight coming from behind, backlit (背後からの光、バックライト)
・loverhead lighting, top-down light (頭上からの光、トップダウンライト)
・lunder lighting, dramatic under glow (アンダーライト、ドラマチックな下からの光)
・llight source at 45 degrees from right:1.3 → かなり具体的に方向指定可能(Fluxで特に効く)
 (から45度の光源:1.3)
照明は「何の光がどこから当たって、どう反射・透過しているか」を想像しながら書くと、AIが忠実に再現してくれます。

・注意点・上級Tips

  • Flux.1 / Flux.2 Pro:照明記述を最後に置き、自然言語で「light gently caressing her face from the window on the left」など描写的に書くと最高精度
    Stable Diffusion系:タグ式(comma区切り)が安定。重みを1.3〜1.6で複数照明混ぜると強い
    Midjourney:–stylize 600〜800 + lightingタグで芸術的に。–ar で構図と合わせて使うと良い。
    光の色温度を入れるとさらに:warm lighting, cool lighting, orange tint, teal and orange
    負のプロンプトに「overexposed, underexposed, flat lighting, harsh shadows」を入れると失敗の確率が低くなります。
    影が弱い時は「deep shadows」「strong contrast」追加してみる。

自然言語によるプロンプト例 – 光線をテーマに

ゴールデンアワーの光の拡散効果はそれらしく表現されていますが、良くありがちなAI画像です。
表現したいのは三次元的な光の粒子の分布状態つまり空気中の微粒子の散乱形数です。まあしかし、これはこれでAI画像生成の楽しみとして良しとしましょう。

まとめ

JSON形式と比べると、自然言語の場合、生成モデルに意図を正しく伝える上で、限界と難しさが伴うことを改めて実感しています。
次回、記事の冒頭で触れた「PBR(Physically Based Rendering)AI画像生成における物理原理レンダリング」に正面から斬り込んでいきます。

投稿者プロフィール

Akira_O
Akira_O
こんにちは、AKIRA Obataです。私はAI技術を活用して、独自のデジタルアートを創作するアーティストです。テクノロジーとクリエイティビティの交差点で、新しい表現の可能性を探求しています。『aigenart』は、私の作品やアイデアを世界に発信する場であり、AIがもたらす美しさや楽しさを皆さんと共有したいと考えています。
PAGE TOP