はじめに
Pod Cast 「JSONと物理法則で描くAI画像」
JSONと物理法則で描くAI画像(Coding realistic images with JSON and PBR)
Google Deep MIndによる Deep Live、対談形式の音声でお伝えいたします。
次の音声ファイル日本語版(19分02秒)、英語版(23分08)をお楽しみください。
いまさら聞けない「Nano Banana Pro」とは
Nano Banana Pro(ナノバナナプロ)は、2025年11月にGoogle DeepMindが開発・発表した画像生成・編集AIモデルです。
従来の「Nano Banana(Gemini 2.5 Flash Image)」の上位モデル(Gemini 3 Pro Image)として位置づけられています。Nano Banana Proは、単なる画像生成にとどまらず、「推論能力を持つ画像生成AI」という新しいカテゴリを切り開きました。
主な特徴と機能は以下の通りです。
1. 圧倒的な文字描写力と日本語対応
これまでの画像生成AIが苦手としていた「画像内への正確な文字入れ」を克服しています。
- 日本語対応: 日本語の文字化けが大幅に改善され、漫画の吹き出しやロゴ、インフォグラフィック、バナー作成などにおいて実用レベルのテキスト表現が可能になりました。
- 高い正確性: 多言語にわたって94%のテキスト正確性を実現しています。
2. 高精細な4K出力と編集自由度
- ネイティブ4K解像度: 最大4096×4096ピクセルの高解像度画像を直接生成できるため、印刷物やプロフェッショナルな制作物にも対応します。
- 柔軟なアスペクト比: 1:1から16:9まで、用途に合わせたサイズ調整が可能です。
- 高度なインペインティング: 生成した画像の一部を指定して編集したり、カメラ角度や照明(昼から夜へなど)を後から調整したりできる「バーチャル・アートディレクター」のような機能を備えています。
3. 一貫性と推論能力
- 検索連動型の推論: Google検索に接続することで、現実世界の最新情報(例:最新スマホの内部構造など)を反映した正確な図解を作成できます。
- キャラクターの一貫性: 最大5人までの特定の人物像を維持したまま、複数の画像を生成できます。
- マルチイメージ構成: 最大14枚の参照画像を読み込み、それらを一つのシーンに統合することが可能です。
Nano Banana 2とNano Banana Proはどう違うの?
「Nano Banana 2(ナノ・バナナ・ツー)」と「Nano Banana Pro(ナノ・バナナ・プロ)」は、ともに高速かつ高品質な画像生成能力を強みとしていますが、用途やコスト面で明確な違いがあります。
結論から言うと、Nano Banana Proは「究極の品質と推論能力」を重視した上位モデルであり、Nano Banana 2は「爆速かつPro並みの品質」を無料で提供することを目指した最新の高速モデルです。
以下に共通点と相違点を詳しく解説します。
1. 共通点
エンジン: 両モデルは、Geminiファミリーの最新画像生成技術(Gemini 2.5 Flash Imageなど)を基盤としている。
特徴的な「文字描写力」: AI画像生成の弱点だった文字化けを克服し、画像の中に正確なテキスト(日本語含む)を描き出す能力が高い。
多用途: ロゴ、インフォグラフィック、グリーティングカード、バナーなど、実用的な画像生成が可能。
利用環境: Google AI Studio、Gemini APIを通じて利用可能。
2. 相違点
最大の違いは、「最高画質・機能性」を追求したProか、「速度・コストパフォーマンス」を追求した2かという点です。
「プロ仕様のこだわり」か「日常使いのスピード」かで性能が分かれています。
| 特徴 | Nano Banana 2 | Nano Banana Pro |
| 強み | 「爆速」生成モデル。Gemini 2.5 Flashを基盤とし、Proに迫る品質を瞬時に出力する。 | 「推論能力」を持つ最高峰モデル。複雑な指示の理解が深く、細部までこだわり抜いた生成が可能。 |
| 生成速度 | 非常に高速(Flashの特性) | 速いが、2よりは少し遅い |
| 品質・精度 | Proに匹敵する「実質Pro」級だが、超高解像度化などはProに劣る場合がある。 | 最上級の描写力・複雑な指示への対応力、図解の正確性や構図の安定性が最も高い。 |
| 料金・コスト | 比較的緩やか。最新モデルを無料で手軽に試せる。 Proより安い(コスパ最強) | 無料版では非常に厳しい(1日約3枚程度)。 1K/4K解像度で$0.134~$0.24/枚程度 |
| API/ツール | Gemini APIで利用可能 | Gemini API, Studioで利用可能 |
| 主な用途 | 実用的なロゴ、バナー、日常利用 | 高解像度イラスト、広告用など |
3. 相違点の解説
生成速度 (2が優位): 「Nano Banana 2」は「Flash」の特性により、スピードを重視している。
表現力・画質 (Proが優位): 「Nano Banana Pro」は、プロフェッショナルな高クオリティな画像や、複雑な指示に基づいた描写に優れており、品質重視のクリエイター向け。
コストパフォーマンス (2が優位): 「Nano Banana 2」は、Proと同等の実用性を保ちながら、API利用料を抑えることができるため、大量生成に向いている。
4. 使い分けの目安
- Nano Banana 2 を選ぶべき状況:
- 速度重視(即座に画像が欲しい)
- 大量の画像を生成したい(SNS用など)
- コストを抑えて実用的な文字入りの画像を作りたい、SNS投稿用や、大量にバリエーションを出して試行錯誤を繰り返したい場合に最適です
- Nano Banana Pro を選ぶべき状況:
- 画質・リアルさ重視(最高品質が欲しい)
- 複雑なプロンプト(指示)で生成したい
- 広告や出版物など、高解像度が求められるプロの現場 、1枚のクオリティに妥協したくない場合や、複雑なロジックを画像に反映させたい場合に最適です
一般的に、日常的な実用シーンでは「2」で十分なケースが多く、デザインやイラストなど品質に妥協したくない場合に「Pro」が適している。
JSON 構造化データが得意なNano Banana Pro
JSONコード(構造化プロンプト)を使用して画像を生成する手法において、特に注目されているのは Google の「Nano Banana Pro」 です。
特徴: 通常、画像生成AIは自然言語による文章(プロンプト)で指示を出しますが、JSON形式を使用することで、キャラクターの配置、背景、スタイル、カメラアングルなどをパラメータとして厳密に指定できる「設計型」の画像生成が可能になります。
情報の結びつきをカッコで閉じ込める(カプセル化する)ことで、AIが要素を混同することなくオブジェクトの配置や属性を正確に指定する「設計する画像生成」を特徴としています。
JSON 構造化データの具体的なメリット
- 再現性の向上: 自然言語の揺らぎを抑え、数値やキーワードで固定できるため、同じ構成の画像を生成しやすくなります。
- 自動化との相性: Python などのプログラムから大量の画像を生成する場合、JSON データとしてプロンプトを管理するのが効率的です。
- 複雑な指示の整理: キャラクター、背景、照明、カメラなどの要素をカプセル化(グループ化)して伝えることで、AI が指示を誤認しにくくなります。
- 要素の分離: 「黒い帽子をかぶったグレーのコートの女性」のような指示で複数の色が混在する場合、構造化データとして色ごとに定義して、色の混ざり現象(カラーブリード)を防ぐことが可能になります。
- 自動化: Pythonなどのプログラムから一括で画像を生成する際、JSONは非常に相性が良いためです。
- 再現性: 複雑な設定をコードとして保存・再利用できるため、デザインのトーンを統一しやすくなります。
肥大化するコード – 文字数増大に対する問題点
サイト内の過去記事「フランス伝統色をJSONプロンプトに埋め込む」(2026年2月7日投稿)の「汎用性のある自然言語+HEX色指定プロンプト」欄でも触れたことですが、JSONコードで一目瞭然なのはとにかく文字数が多い。数千文字から一万文字近くになることも珍しくありません。この文字数が多いために画像生成ができないことがあります。
例えばFLUX-AI.IOなどのプラットフォームからJSONを実行しようとしてもコンテキストボックスに入力可能な文字数最大2,000文字という制限があります。つまり文字数の多いJSONコードは入力できません。この場合どうしても自然言語に頼らざるを得ないわけですが、Google Nano Banana Proでの生成においては、**JSON(JSON公式WEBサイト – JSONの規格・構文に関する最も基本的な公式ページです)の基準に準拠した構造化されたコードであれば文字数3,000〜4,000文字程度でも画像生成に関しては問題は起きていません。
自然言語プロンプトの場合は通常は1,000~2,000トークン程度が適切です。長すぎると最初や最後にある情報が優先され、中間の情報が無視されなどAIは内容を無視する(情報の埋没 (Lost in the Middle)場合がありますので注意が必要です。
また単に文字の数だけでなく、単語や文字の組み合わせがトークン化されるため、日本語よりも英語の方が詳細を伝えやすい傾向も無視できません。
**JSONの概要
JSONは、軽量なデータ交換フォーマットであり、人間にとって読み書きが容易で、マシンにとっても簡単にパース(解析)や生成を行える形式です。
特徴:
テキストベース: テキスト形式で記述されるため、可読性が高い。
言語独立: JavaScriptをベースにしていますが、C、C++、C#、Java、PHP、Python、Rubyなど多くの言語でサポートされています。
名前/値のペア:{ "key": "value" }の形式。
配列: 順序付きリスト[ ... ]。
データ型: 文字列、数値、null、bool値(true/false)、オブジェクト、配列。
用途: Web APIのレスポンスや、サーバーとWebアプリケーション間のデータ転送で広く使用されています。
注意点: コメントの記述は不可、データ構造が複雑になりやすい。
引用:→Google AI mode「JSON オフィシャル情報」
19世紀パリ、歴史的建造物の空間を生成する
物語の重要性
キーワードを羅列するのではなく、Nano Banana Proの強み、深い言語理解力を生かすため、断片的な単語の羅列よりも、ストーリー性のある概要を記述します。
1.生成するシーンの説明:
ステップ1:頭の中でイメージする生成したい画像の概要を自然言語(日本語)で書き起こします。
概要:
1875年に完成したパリ・オペラ座(パレ・ガルニエ)の壮大な大階段、その豪華な建築と華麗な細部を表現します。
1. 中央部と下部を占める、2つに分かれた大理石の壮大な階段が、豪華に装飾された複数の階層のギャラリーへと続いている様子を描いています。明るい色の大理石で作られた階段は、2つの優雅な曲線に分かれており、それぞれは、彫刻が施された暗い色の木製の手すりと、明るい色の石で作られた欄干で飾られています。手すりと壁に沿って、無数の精巧な燭台の光が周囲を照らし、空間全体に暖かく、ほのかな空間を演出しています。階段の中央手すり柱には、いくつかの大型の暗色ブロンズ像が配置されています。
2. 空間を圧倒する建築様式は驚くほど精巧で、磨かれた大理石の柱、アーチ、バルコニーが特徴的です。これらは様々な茶色、クリーム色、金色調で表現され、異なる種類の大理石と金箔装飾を示唆している。あらゆる表面は複雑な彫刻、渦巻き模様、レリーフで広範囲に装飾され、ヴィクトリア朝またはバロック様式の壮麗さを醸し出しています。上層階には手すりの付いたバルコニーとアーチ型の開口部が設けられ、壮大な建物内部のさらなる廊下や部屋を覗かせている。
3. 頭上には古典的なフレスコ画の大作が広がり、流れるような衣裳をまとった人物や柔らかな雲海を背景に、神話的・寓意的な情景が描かれている。下から漏れる温かな光に照らされた天井全体は、富と崇高な芸術的表現、建築的壮麗さを伝えるべく緻密に設計されている。生成画像には人物や動物は一切描かれておらず、建築物そのものが唯一のテーマ、焦点となっている。
4. 壮麗さと優雅さ、歴史の重みが漂う雰囲気です。温かな照明が、居心地の良さと畏敬の念を同時に喚起し、重要な社交行事や芸術公演のために設計された空間を思わせる。全体として、時代を超えた美しさと卓越した職人技が感じられ建築空間です。
ステップ2:以上の概要を生成モデル(Nano Banana Pro)に引き継ぐために英語に翻訳します。
モデルに複雑な指示を与える場合、単語や文字の組み合わせがトークン化されるため、日本語よりも英語の方が詳細を伝えやすい傾向があります。(経験上、日本語ではなく英語の方が良い結果が得られることが多いです。)
英語での自然言語プロンプトによるNano Banana Proでの生成画像

→概要の自然言語によるプロンプト:コードは注意してご使用ください。
This work depicts the magnificent grand staircase of the Paris Opera House (Palais Garnier), completed in 1875, capturing its opulent architecture and exquisite details.
1. It depicts the grand, two-part marble staircase—which occupies the central and lower sections—leading up to the lavishly decorated galleries on multiple levels. Crafted from light-colored marble, the staircase splits into two elegant curves, each adorned with carved dark-wood handrails and balustrades made of light-colored stone. Along the handrails and walls, countless intricate candelabras illuminate the surroundings, creating a warm and subtle ambiance throughout the space. Several large dark bronze statues are placed on the central balusters of the staircase.
2. The overwhelming architectural style is astonishingly intricate, characterized by polished marble columns, arches, and balconies. These are rendered in various shades of brown, cream, and gold, suggesting different types of marble and gilded decorations. Every surface is extensively adorned with intricate carvings, swirl patterns, and reliefs, evoking the grandeur of the Victorian or Baroque styles. The upper floors feature balustraded balconies and arched openings, offering glimpses into further corridors and rooms within the magnificent building.
3. Above, a grand classical fresco unfolds, depicting mythological and allegorical scenes against a backdrop of figures in flowing robes and a sea of soft clouds. Illuminated by warm light filtering from below, the entire ceiling is meticulously designed to convey wealth, sublime artistic expression, and architectural grandeur. The generated image contains no figures or animals whatsoever; the architecture itself is the sole theme and focal point.
「壮大な大階段、その豪華な建築と華麗な細部を表現」「頭上には古典的なフレスコ画の大作」「明るい色の大理石で作られた階段は、2つの優雅な曲線に分かれており、それぞれは、彫刻が施された暗い色の木製の手すりと、明るい色の石で作られた欄干で飾られています」これらのすべての要素は確かに再現されています。
しかし構図やカメラ、レンズのパラメータ指示がないため、平凡な表現といわざるを得ません。
その辺りの不満要素を次のJSONプロンプトではたして解決へとつながるのか?
ではさらに追求を深め、Nano Banana Pro に対応した JSON(マークダウン+スライダー仕様)、
最終的にはPBR (Physically Based Rendering) の物理原理に基づくレンダリングまでいきます。
それでは引き続きお付き合いください。
Nano Banana Pro用JSONコード(マークダウン+スライダー仕様)での生成画像
Nano Banana Pro に対応した JSON ベースの設定(英語版)で、再利用可能なテンプレートとして構成されています。
これは、前記の詳細な概要(ガルニエ宮の大階段)を基に、高精細な建築ビジュアライゼーションを行うために設計されています。
このフォーマットは、Nano Banana Pro の JSON プロンプト作成における一般的なコミュニティのパターンに従っています。具体的には、説明文、制約条件、照明・カメラ・スタイルのパラメータ、および精度と一貫性を最大化するための明確な回避ルールを、明確に分類されたセクションに整理しています。

JSON code for Nano Banana Pro Markdown slider specifications
→Nano Banana Pro用JSONコード(マークダウン+スライダー仕様):コードは注意してご使用ください。
{
“label”: “palais-garnier-grand-staircase”,
“tags”: [
“opulent architecture”,
“Baroque Revival”,
“grand staircase”,
“Palais Garnier”,
“Paris Opera House”,
“19th-century French architecture”,
“No people”,
“No people”,
“No animals”
],
“Usage”: “Architectural reference”,
“Style”: “Photorealistic architectural photography, extremely detailed, museum quality, timeless elegance”,
“Subject”: {
“Main”: “The magnificent marble Grand Staircase of the Palais Garnier (Paris Opera House), completed in 1875”,
“description”: “A central double-flight staircase crafted from light-colored marble. Two symmetrical branches curve gracefully upward, leading to lavishly decorated multi-tiered galleries. It features dark wood carved handrails and balustrades, light-colored stone newel posts, and a large dark bronze statue placed in the center”
},
“composition”: {
“framing”: “A wide-angle view centered on the large dark bronze statue. The asymmetrical composition, looking up from a low-to-medium vantage point at a 45-degree angle, emphasizes its grandeur and height”,
“perspective”: “A gentle upward angle that highlights the flowing curves and multi-layered structure”,
“focal_length”: “24–35mm (35mm equivalent). Moderate wide-angle distortion to create a dramatic sense of scale”
},
“lighting”: {
“main”: “Warm, subdued indirect lighting emanating from countless intricate candelabras lining the railings and walls”,
“quality”: “Soft golden glow; gentle highlights that softly accentuate the details of marble and gilded work; deep, delicate shadows that highlight the sculptures and depth”,
“mood”: “Elegant and awe-inspiring, evoking historical opulence and tranquility”
},
“colors”: {
‘palette’: “Pale cream and beige marble, warm browns, rich gold leaf accents, polished dark bronze sculptures, and cream and gold upper galleries”,
“tones”: “Rich, high-saturation, yet harmonious; luxurious and glamorous”
},
“details”: {
‘foreground’: “In-focus, intricately carved handrails and balustrades”,
“midground”: “Spacious marble staircase, bronze statues standing on the central balustrade”,
“background”: “Arched openings, polished marble columns, upper-level balconies with railings, and a glimpse of the colonnade in the distance”,
“ceiling”: “Grand classical-style frescoes depicting mythological and allegorical scenes, figures clad in flowing robes, soft clouds, and dramatically lit from below”
},
“parameters”: {
“resolution”: “2K or 4K”,
“aspect_ratio”: “3:4 or 4:3 (portrait orientation recommended to emphasize the grandeur of the staircase)”,
“detail_level”: 0.95,
“fidelity”: 0.98,
“realism”: 0.92,
“artifacts”: 0.05
},
“constraints”: {
“must_have”: [
“No people, animals, or modern elements”,
“Focus solely on architectural and decorative details”,
“Visible highly intricate carvings, swirl patterns, and reliefs”,
“A warm, historical atmosphere that conveys timeless beauty and craftsmanship”
],
“must_avoid”: [
“People or crowds”,
“Cartoonish or low-resolution depictions”,
“Excessively bright modern lighting”,
“Flat composition”,
“Unnatural colors with excessive saturation”
]
},
“negative”: “People, humans, human figures, animals, text, watermarks, modern furniture, blurry images, low resolution, cartoon-style, sketches, painterly style, distorted architecture”
}
Translated with DeepL.com (free version)
→JSONの日本語訳文
{
「label」: 「palais-garnier-grand-staircase」,
「tags」: [
「豪華な建築」,
「バロック・リバイバル」,
「大階段」,
「ガルニエ宮」,
「パリ・オペラ座」,
「19世紀のフランス建築」,
「人物なし」,
「人物なし」,
「動物なし」
],
「用途」: 「建築の見本」,
「スタイル」: 「フォトリアリスティックな建築写真、極めて詳細、美術館品質、時代を超えた優雅さ」,
「被写体」: {
「メイン」: 「1875年に完成したパレ・ガルニエ(パリ・オペラ座)の壮麗な大理石のグランド・ステアケース」,
「description」: 「明るい色の大理石で作られた中央の2分割式階段。2本の対称的な枝分かれが優雅に曲がり、豪華に装飾された多層のギャラリーへと上へと続いている。ダークウッドの彫刻が施された手すりや欄干、明るい色の石製の手すり柱があり、中央部には大きなダークブロンズの彫像が置かれている」
},
「composition」: {
「framing」: 「大型の暗色ブロンズ像を中心に捉えた広角ビュー。非対称的な構図で、斜め45度、低~中程度の視点から上を見上げることで、その壮大さと高さを強調」,
「perspective」: 「緩やかな上向きのアングルで、流れるような曲線と多層構造を際立たせる」,
「focal_length」: 「35mm換算24-35mm。ドラマチックなスケール感を演出するための適度な広角歪み」
},
「lighting」: {
「main」: 「手すりや壁に沿って無数に並ぶ精巧な燭台から放たれる、温かく控えめな間接照明」,
「quality」: 「柔らかな黄金色の輝き、大理石や金箔細工のディテールに優しく映えるハイライト、彫刻や奥行きを際立たせる深みのある繊細な影」,
「mood」: 「優雅で畏敬の念を抱かせる、歴史的な豪華さと安らぎを醸し出す」
},
「colors」: {
「palette」: 「淡いクリーム色とベージュの大理石、温かみのある茶色、豊かな金箔のアクセント、磨き上げられたダークブロンズの彫像、クリーム色と金色の上層ギャラリー」,
「tones」: 「豊かで彩度が高く、かつ調和が取れており、豪華で華やか」
},
「details」: {
「foreground」: 「焦点が当たる、精巧に彫刻された手すりや欄干」,
「midground」: 「広々とした大理石の階段、中央の欄干に立つブロンズ像」,
「background」: 「アーチ型の開口部、磨き上げられた大理石の柱、上層階の手すり付きバルコニー、奥の回廊がちらりと見える」,
「ceiling」: 「神話や寓意の場面を描いた壮大な古典様式のフレスコ画、流れるような衣をまとった人物、柔らかな雲、下から劇的に照らされている」
},
「parameters」: {
「resolution」: 「2Kまたは4K」,
「aspect_ratio」: 「3:4または4:3(階段の壮大さを強調するには縦長が推奨)」,
「detail_level」: 0.95,
「fidelity」: 0.98,
「realism」: 0.92,
「artifacts」: 0.05
},
「constraints」: {
「must_have」: [
「人物、動物、現代的な要素は含まない」,
「建築と装飾的な細部にのみ焦点を当てる」,
「非常に精巧な彫刻、渦巻き模様、レリーフが確認できる」,
「時代を超えた美しさと職人技を感じさせる、温かみのある歴史的な雰囲気」
],
「must_avoid」: [
「人物や群衆」,
「漫画的または低精細な描写」,
「過度に明るい現代的な照明」,
「平面的な構図」,
「彩度が高すぎて不自然な色」
]
},
「negative」: 「人物、人間、人物像、動物、テキスト、透かし、現代的な家具、ぼやけた画像、低解像度、漫画風、スケッチ、絵画風、変形した建築物」
}
多くのNano Banana Proインターフェース(Gemini API、ComfyUIノード、サードパーティ製ツールなど)では、数値スライダーが利用可能です。この基本JSONを微調整する際の推奨範囲とデフォルト値は以下の通りです:
下記の「スライダーパラメータ」の項目事項、特に「構図の非対称性」、「照明の暖かさ」「被写界深度」、「カメラ設定」の要素が効いています。しかし大理石の床面に注目してください。この生成では磨き上げられた大理石の質感が生きていません。さらに光の反射、拡散など光の表現に不満が残ります。
スライダーパラメータ
| パラメータ | 設定数値 | 範囲 | 説明 |
|---|---|---|---|
| 詳細レベル Detail Level — Range | 0.95 | 0~1.0 | 超詳細な建築レンダリング。数値が高いほど、彫刻やレリーフが鮮明になります |
| 忠実度 Fidelity / Prompt Adherence | 0.98 | 0~1.0 | 数値が高いほど、「人物なし」ルールや構造への準拠が厳格になります |
| リアリズム/フォトリアリズム Realism / Photorealism | 0.92 | 0~1.0 | 照明に芸術的な温かみを残すため、最大値よりわずかに低く設定 |
| アーティファクト低減 Artifacts Reduction | 0.05 – 0.15 | 0.0~1.0 | 低い値に設定すると、複雑なディテールが保持される |
| 照明の暖かさ Lighting Warmth | 0.75 | 0.0~1.0 | 黄金色の雰囲気の強さを調整 |
| 構図の対称性 Composition Symmetry | 0.90 | 0.0~1.0 | 高い値に設定すると、階段の分割がバランスよく配置される |
| テクスチャ強調 Texture Enhancement | 0.88 | 0~1 | 大理石、金箔、フレスコ画の細部 |
| 被写界深度 Depth of field | 0.85 | 0~1 | ホール全体が鮮明に映る |
カメラ設定
| 設定 | 価値 |
|---|---|
| カメラアングル | 斜め45度からの視点 |
| ショットの種類 | 幅広い建築ショット |
| レンズ | 24mm建築用レンズ |
| 深さ | 深い |
| 構成 | 中心に大型の暗色ブロンズ像 |
PBR (Physically Based Rendering) の物理原理に基づく生成画像
Nano Banana Pro(Geminiベース)は直接的なPBRパラメータ(metallic/roughness/iorなどの数値スライダー)をJSONでネイティブに持っていないため、主に以下の方法で対応します:
- プロンプト内でPBR原則を明示的に指示(正確な光の反射・屈折・エネルギー保存・現実的な素材挙動)
- materials セクションを新設し、各主要素材にPBR的な記述を追加
- rendering / technical セクションで物理ベースのレンダリングを要求
- パラメータでrealismとfidelityを高く保ちつつ、物理矛盾を避ける指示を強化します。

Rendering based on the physical principles of PBR (Physically Based Rendering)
→PBRの物理原理に基づくレンダリングを強く意識・促進する要素を追加したフルコード:コードは注意してご使用ください。
{
"label": "palais-garnier-grand-staircase-pbr",
"tags": [
"opulent architecture",
"Baroque revival",
"grand staircase",
"Palais Garnier",
"Paris Opera House",
"19th century French architecture",
"PBR rendering",
"physically based rendering",
"photorealistic materials",
"no people",
"no figures",
"no animals"
],
"purpose": "architectural showcase with physically accurate material rendering",
"style": "ultra-realistic architectural visualization, physically based rendering (PBR), ray-traced quality, high-fidelity material response, energy-conserving reflections, museum-grade photorealism",
"rendering": {
"engine": "physically based rendering pipeline simulation",
"principles": "strict adherence to physically based shading, energy conservation, realistic Fresnel effect, accurate specular and diffuse separation, microsurface scattering on stone/marble, correct GGX microfacet distribution for metals and polished surfaces",
"quality": "ray-tracing level detail, global illumination approximation, no baked lighting artifacts, physically plausible light transport",
"constraints": "no stylized NPR/toon shading, no unrealistic bloom/glow unless from real candelabra sources, correct energy conservation (reflections cannot be brighter than light source)"
},
"subject": {
"main": "The magnificent grand marble staircase of the Palais Garnier (Paris Opera House), completed in 1875",
"description": "Central two-part split staircase in light-colored marble, curving elegantly in two symmetrical branches leading upward to lavishly decorated multi-level galleries, dark-wood carved handrails and balustrades, light stone balusters with large dark bronze statues placed on central sections"
},
"materials": {
"marble_staircase": {
"type": "polished stone / marble",
"pbr_description": "high albedo cream/beige marble with subtle veining, low roughness (0.08–0.15), medium specular, realistic subsurface scattering, slight translucency on thin edges, correct Fresnel darkening at grazing angles",
"finish": "polished but with realistic micro-imperfections and age patina"
},
"dark_wood_handrails": {
"type": "polished hardwood",
"pbr_description": "dark walnut/mahogany, medium roughness (0.25–0.40), high specular with warm wood grain reflections, subtle anisotropic highlights along grain direction, realistic clear coat layer simulation",
"finish": "hand-rubbed oil finish with natural imperfections"
},
"bronze_statues": {
"type": "dark bronze metal",
"pbr_description": "aged dark bronze, high metalness (0.95–1.0), medium roughness (0.3–0.45), strong GGX specular lobes, realistic oxidation patina with green verdigris in recesses, correct metallic Fresnel edge tint",
"finish": "historical aged patina, no overly clean chrome look"
},
"gilded_details": {
"type": "gold leaf / gilded ornament",
"pbr_description": "pure gold surface, very high metalness (1.0), very low roughness (0.05–0.12), intense specular highlights with warm color tint, realistic color shift at grazing angles",
"finish": "hand-applied gold leaf with subtle crackle and age variation"
},
"candela_brass": {
"type": "brass / ormolu",
"pbr_description": "polished brass with high reflectivity, medium-high metalness, low roughness, warm specular color, realistic fingerprints and micro-scratches"
}
},
"composition": {
"framing": "wide angle view centered on the staircase, symmetrical composition, low to mid vantage point looking upward to emphasize grandeur and height",
"perspective": "slight upward angle to showcase the sweeping curves and multi-level structure",
"focal_length": "24-35mm equivalent, moderate wide-angle distortion for dramatic scale"
},
"lighting": {
"main": "Warm, subtle ambient illumination from countless intricate candelabras lining handrails and walls",
"quality": "physically accurate multi-point warm candlelight sources, realistic inverse-square falloff, soft golden glow with correct shadow softness, gentle volumetric scattering in air, accurate caustics on polished surfaces if applicable",
"mood": "elegant and awe-inspiring, evoking historical luxury and comfort, physically plausible contrast ratio"
},
"colors": {
"palette": "light cream and beige marble, warm browns, rich gold leaf accents, polished dark bronze statues, cream and gold upper galleries",
"tones": "rich, saturated yet harmonious, luxurious and opulent, white-balanced for accurate material color under warm light"
},
"details": {
"foreground": "Intricate carved balustrades and handrails in focus, realistic microsurface detail and bump/normal simulation",
"midground": "Sweeping marble steps, bronze statues on central balusters with accurate specular response",
"background": "Arched openings, polished marble columns, balustraded balconies on upper levels, glimpses of further corridors",
"ceiling": "Grand classical fresco with mythological and allegorical scenes, flowing robed figures, soft clouds, dramatically lit from below with physically correct light bounce"
},
"parameters": {
"resolution": "4K recommended",
"aspect_ratio": "3:4 or 4:3 (vertical emphasis recommended for staircase grandeur)",
"detail_level": 0.97,
"fidelity": 0.99,
"realism": 0.96,
"artifacts": 0.03,
"physics_accuracy": 0.95,
"material_fidelity": 0.94
},
"constraints": {
"must_have": [
"Strict physically based rendering behavior for all materials",
"Realistic light interaction: correct reflection, refraction, diffuse bounce",
"No human figures, no animals, no modern elements",
"Pure focus on architecture and decorative details with PBR accuracy",
"Highly intricate carvings, swirl patterns, reliefs with microsurface detail",
"Warm historical ambiance with physically plausible lighting and timeless beauty"
],
"must_avoid": [
"People or crowds",
"Cartoonish, NPR, or non-photorealistic rendering",
"Unphysical glowing, over-bright reflections, energy violation",
"Plastic/toy-like materials, flat shading",
"Harsh modern lighting or incorrect shadow behavior",
"Flat composition or ignored Fresnel effects"
]
},
"negative": "people, humans, figures, animals, text, watermark, modern furniture, blurry, low resolution, cartoon, sketch, painting style, deformed architecture, plastic skin, non-PBR shading, glowing edges, energy non-conserving reflections, incorrect Fresnel"
}
スライダーパラメータ
| パラメータ | 設定数値 | 範囲 | 説明 |
|---|---|---|---|
| 詳細レベル Detail Level — Range | 0.97 | 0.1〜1.0 | スカルプトやマテリアルの細部を強調 |
| 忠実度 Fidelity / Prompt Adherence | 0.99 | 0〜1.0 | PBRの指示を厳密に遵守 |
| リアリズム/フォトリアリズム Realism / Photorealism | 0.96 | 0〜1.0 | 物理的なリアリズムを最大化 |
| 素材の再現性、材料の忠実度、質感の再現度 material_fidelity | 0.94 | 0〜1.0 | 各マテリアルのPBR特性の再現 |
| アーティファクト低減 Artifacts Reduction | 0.03 | 0〜1.0 | ディテールを損なわない最小設定 |
| 物理演算の精度 physics_accuracy | 0.95 | 0〜1.0 | 光の挙動と影の精度 |
| 色温度、雰囲気 lighting_warmth | 0.70〜0.80 | 0〜1.0 | 過度な明るさを避けつつ、歴史的な温かみを維持 |
このJSONをNano Banana Proに直接貼り付けて使用します。
PBRの挙動を最大限に引き出すには、「physically based」、「PBR」、「energy conserving」、「correct Fresnel」、「realistic microsurface」などのキーワードが非常に効果的ですので、必要に応じてさらに強調することも実験での想定内です。
まとめ
自然言語によるプロンプトからJSONによる生成要素の明確な指定、さらに前回の記事『最新の画像生成AIのパフォーマンスを生かすために』の冒頭でアナウンス的に触れた「物理法則による現実の再構築」-PBRによるレンダリングへと進めてきました。
下記の「スライダーパラメータ」の設定数値をひとつひとつ検証し、テンプレート化することにより効率化と完成度の追求につながるのではないかと思います。
投稿者プロフィール

- こんにちは、AKIRA Obataです。私はAI技術を活用して、独自のデジタルアートを創作するアーティストです。テクノロジーとクリエイティビティの交差点で、新しい表現の可能性を探求しています。『aigenart』は、私の作品やアイデアを世界に発信する場であり、AIがもたらす美しさや楽しさを皆さんと共有したいと考えています。
最新の投稿
JSON2026-03-17Nano Banana Proで使うJSON + PBR – 徹底解説
JSON2026-03-11最新の画像生成AIのパフォーマンスを生かすために
Prompt2026-03-09画像生成の完成度を高めるためのカラーコード変換ツール – その使い方
Tools2026-03-08イタリア伝統色 全200色 選択ツール