注記:本記事はGPT-4o期の対話ログをもとにしています。
🙂 タケ:
「オープンカフェ。ロングヘアーの女性がノートPCで作業をしている。構図はPCの画面全体が見える角度で固定。女性は1秒後PCを閉じてPCを持って立ち去る。」この文をSoraが解釈しやすいように英語にして。
🤖 チャットさん:
以下が、あなたのプロンプトをSora(英語中心で学習されたモデル)が理解しやすく、自然で具体的な英語プロンプトにした例です:
✏️英語プロンプト(Sora向け最適化)
An open-air café. A long-haired woman is working on a laptop. The camera is fixed at an angle that shows the full screen of the laptop. After 1 second, she closes the laptop, picks it up, and walks away.
🔍 解説ポイント
日本語 | 英語表現 | 理由 |
---|---|---|
オープン カフェ |
An open-air café | “outdoor café”でもOKだが、 映画調にはこっちが映える |
ロングヘアの女性 | A long-haired woman | 視覚的にシンプルで伝わりやすい |
ノートPCで 作業中 |
is working on a laptop | “typing”より広義で自然 |
画面全体が 見える構図 |
camera is fixed at an angle that shows the full screen | カメラの意図を明確化 |
1秒後… | After 1 second… | モデルは「時間経過」も理解できるため有効 |
立ち去る | walks away | 動作を具体的に指示 (「away」で奥行きを含む) |
✴️ Optional Add-ons(必要に応じて)
雰囲気を追加するなら:
…in soft morning light, with ambient café sounds in the background.
スタイル指定も可能:
in cinematic style with shallow depth of field
🤖 チャットさん:
必要ならこのプロンプトをベースに「スタイルを変える」「背景を加える」「天気を設定する」などもできます。調整してみましょうか?
🙂 タケ:
君が書いてくれた雰囲気とスタイル指定も追加して。
🤖 チャットさん:
もちろん、以下が雰囲気とスタイル指定を含めた完成版のSora向け英語プロンプトです:
✏️【 prompt_004_01】最終プロンプト(雰囲気+スタイル込み)
An open-air café. A long-haired woman is working on a laptop. The camera is fixed at an angle that shows the full screen of the laptop. After 1 second, she closes the laptop, picks it up, and walks away. The scene is bathed in soft morning light, with ambient café sounds in the background. Shot in a cinematic style with shallow depth of field.
🎥 含まれている要素
シーン設定:Open-air café
人物の行動:作業 → 閉じる → 持ち上げ → 立ち去る
カメラ構図:ノートPC画面全体が見える固定アングル
雰囲気:朝のやわらかい光、カフェの環境音
スタイル:映画的、背景ボケあり(被写界深度)
🙂 タケ:
Soraに投げてみたけどPCを持って立ち去るところがない。秒数延長したほうがいい?動画を君に見せたら改善方法、教えてくれる?
🤖 チャットさん:
はい、動画を見せていただければ改善方法を具体的にアドバイスできます。以下のような点をチェックします:
🔍 チェックポイント(動画確認後に見る内容)
「1秒後に立ち去る」動作がない理由
→ 動作開始タイミングが早すぎる/遅すぎる?
→ Soraが「walk away」の指示を認識できなかった?
→ 動画の尺が短くて「去る前に終わっている」?
全体の尺(秒数)が十分かどうか
→ 立ち上がって持ち歩くまでに最低でも5〜6秒は必要です。
カメラ固定条件が動作表現を制限していないか
→「カメラが固定されたまま」だと動作が画角の外に出て無視される場合があります。
✅ 動画で判断できること
・モーションの自然さ
・時間配分のバランス(作業/閉じる/持ち上げ/去る)
・そもそも「歩き出す」というアニメーションが入っているか
🎥 次のステップ
動画ファイル(mp4など)をこのチャットにドラッグ&ドロップしてください。
確認後、以下のように改善案をお伝えできます:
・プロンプト調整案
・タイミングや描写強調の方法
・必要であれば 英語での再構成案
お待ちしています!
🙂 タケ:
動画ファイル張り付けたよ。もっとPC画面を大きくしてほしい。
後でその画面にBlenderで作った動画をはめ込むから。
🎬【 prompt_004_01】
受け取りました。今いただいた動画を確認したところ、以下の改善ポイントが見えてきました:
🎞️ 現在の動画の状態(確認結果)
✅ 改善ポイントと新しいプロンプト案
① PC画面を大きく映す
現状:バストショット → PCが小さい
対策:ズームイン/ローアングル/PC越しの視点に変更
✏️【 prompt_004_02】英語プロンプト改善例
An open-air café. A long-haired woman is working on a laptop. The camera is tightly framed to fully show the laptop screen, with only the woman's hands and torso partially visible. After 2 seconds, she closes the laptop, picks it up, and walks away. The scene is bathed in soft morning light with ambient café sounds. Cinematic style, shallow depth of field.
👉 変更点:
・tightly framed(狭い構図)でPCを大きく
・only hands and torso partially visibleで女性の全身が映らないよう制限
・after 2 secondsで動作を見せる尺を確保
② 尺を延ばす(最低12〜15秒)
walk away が含まれる場合、生成動画の長さを意識する必要あり
Soraは通常 5〜8秒の動画を生成しますが、プロンプトをしっかり書けば15秒までいける場合があります。
🔧 注:現時点ではプロンプト内で「duration: 15 seconds」のような指定はSoraには直接効きませんが、詳細な動作を加えることで長めの動画になることが多いです。
🤖 チャットさん:
次回結果も見せていただければ、さらに画面の角度や照明のコントロール方法まで最適化できます!
🙂 タケ:
動画ファイル張り付けたよ。
やっぱり、立ち去るところがない。タイピングするところいらない。
PC閉じるまでは構図固定してほしい。改善お願い。
🎬【 prompt_004_02】
タイピングが不要とのことですが、冒頭に数秒間「作業シーン」が描写されています。
PCを閉じる動きまではあるものの、立ち去る動作が再び入っていません。
構図(カメラアングル)もまだ固定されきっておらず、微妙なズームや揺れが入っています。
✅ 改善点を明確化すると…
要素 | 改善ポイント | 理由 |
---|---|---|
🧍♀️ 動作 | タイピングを削除 | 無駄な尺消費・意図とズレている |
💻 アングル | PC画面が中心・固定 | Blender合成のため、画角がぶれ ない必要あり |
🚶♀️ 動き | ラップトップを閉じ→持ち上げ →立ち去る |
シーン完結に必要だが現状カット されてる可能性大 |
⏱️ 時間配分 | PC閉じる:2秒 立ち去る:4〜5秒 |
合計10秒程度は最低必要 |
✳️ 最適化した英語プロンプト(Sora向け)⇒ 応答遅延、生成できず
A quiet open-air café. A long-haired woman is sitting at a table with an open laptop in front of her. The camera is fixed and tightly framed to fully show the laptop screen. She is sitting still, not typing. After 2 seconds, she closes the laptop, picks it up, and walks away out of frame. The camera remains static and does not follow her. The lighting is soft and warm, as in early morning. Shot in cinematic style with shallow depth of field.
🔍 解説・強化ポイント
・not typingで冒頭の不要動作を排除
・camera is fixed and tightly framed → 構図が動かないよう明示
・walks away out of frame → 立ち去る動作を完了させ、カメラは追従しない指示
・After 2 seconds... → 行動のトリガーを時間で明示
全体を通して約10秒以上の描写を期待(現時点では確実ではないが、長めに生成される傾向がある)
⏭️ 次のアクション
1. 上記プロンプトで再生成
2. 動画結果を共有してもらえれば、さらに:
🙂 タケ:
15秒が選べないのはなぜ?
🤖 チャットさん:
現時点で「15秒」を明示的に選べないのは、Sora(OpenAI)が対応する動画の時間設定が
以下のように離散的な最大上限になっているためです:
⏱️ Soraの動画長の制限
プラン | 最大長さ | 解像度 |
---|---|---|
ChatGPT Plus | 10秒 | 720p、2本同時生成 blog.vive.com+12learn.microsoft.com+12businessinsider.com+12 |
ChatGPT Pro | 20秒 | 1080p、3本同時生成まで可能 |
Plusプランでは10秒、Proプランでは20秒までしか生成できません。
「15秒」などの任意の中間の長さはサポートしておらず、10秒か20秒しか選べません。
また、APIやUIでも長さは1〜20秒の範囲で、自由入力による「任意の秒数」は指定できず、
自動でモデルが最適化します tech.co+3autogpt.net+3reddit.com+3
🎯 なぜ15秒を選べないのか?
モデル設計上の制限
Soraは1〜20秒の範囲で生成可能ですが、プロンプトで「15秒」と指定しても、
モデル側で「最大長か短いほう」を選ぶ仕様になっています。
プランに応じた上限
Plusでは10秒、Proでは20秒が上限で、その枠内で可変長生成される仕組みです。
💡 対策方法
10~20秒に収めたい場合:
・Plusユーザーは10秒生成、尺が足りなければProにアップグレードして20秒生成可能にする。
中間尺が絶対に必要な場合:
・今のところSoraは対応していないため、20秒生成 → Blenderで編集するのが実用的。
✅ まとめ
「15秒」は標準提供されておらず、10秒 or 20秒の生成になります。
もしProプラン利用が可能なら、20秒生成後に後処理で切り出すのが最も現実的です。
今後Soraが中間時間の選択をサポートする可能性もありますが、現時点ではこのような仕様になっています。
🙂 タケ:
了解。こちらも10秒で収まればそのほうがいい。
🤖 チャットさん:
了解です!それなら、Soraで10秒以内に収めつつ、Blenderで合成しやすい映像を得るためのプロンプト設計を最適化しましょう。
✅ 10秒以内に収まるプロンプト(改良版)⇒ 応答遅延、生成できず
A quiet open-air café. A long-haired woman is sitting still at a table with an open laptop. The camera is fixed and tightly framed, clearly showing the full laptop screen. After 2 seconds, she closes the laptop, picks it up, and walks away out of frame. The lighting is warm and soft, like early morning. Shot in cinematic style with shallow depth of field.
🔍 このプロンプトの狙い
要素 | 説明 |
---|---|
sitting still | タイピングや無駄な動きを排除 |
camera is fixed and tightly framed | PC画面を大きく&構図を安定化 (Blender合成に有利) |
after 2 seconds... | 動作の開始タイミングを明確に制御 |
walks away out of frame | “立ち去る”動作を明確に指示、かつカメラは追従しない |
10秒尺に収まる前提で 内容を圧縮 |
動きが速すぎず、かつ完結する流れに調整済み |
🎯 次のステップ
このプロンプトで生成してみて、もし「立ち去り動作が入りきらない」場合は
🙂 タケ:
生成に5分以上かかってる。まだ待ってたほうがいいのかな?
🤖 チャットさん:
5分以上かかっている場合、以下の状況が考えられます:
🕓 動画生成に時間がかかる主な理由
理由 | 内容 |
---|---|
🎞️ プロンプトが複雑 | 複数動作(閉じる→持つ→歩く)やカメラ固定、 シネマティックなど、処理負荷が高い場合がある |
☁️ サーバー負荷が高い | Soraは人気機能のため、混雑時は生成に10分以上 かかることもある(特に夕方~夜) |
🔄 内部リトライ中 | 成功率が不安定な内容だと、Soraがバックエンドで 何度か試行錯誤をしている可能性あり |
🚫 生成失敗扱いになることも | 10分を超えても返ってこない場合、最終的に エラー終了またはスキップ扱いになるケースあり |
⏱️ 結論:最大10分〜12分待って、それでも返ってこなければキャンセル推奨
その後、以下の対策を取ると◎:
✅ 対策案
1. プロンプトを軽くする
例:She closes the laptop and walks away. → She closes the laptop and stands up.
→ 歩く描写を省くと成功率が上がる傾向があります。
2. 時間帯をずらす
混雑する時間帯(日本時間の17:00〜22:00)は生成が遅延しがち。
→ 朝~昼に試すと生成がスムーズ。
3. 別ウィンドウで再生成
元のウィンドウをそのままにして、新規で同じプロンプトを投げてみるのも手。稀に1本目が固まっていても2本目は成功することがあります。
📩 希望があれば…
・タイミングをずらして使うための軽量版プロンプト
・カメラを動かさず、立ち去り描写を安全に入れる代替表現
・Blenderで後から立ち去り動作を作る構成案
なども提案できます。
今の進行状況、もう少し待ってみるか・キャンセルしてやり直すか、どちらにしますか?
🙂 タケ:
10分まで待つよ。こっちのマシンスペックは影響するの?
🤖 チャットさん:
いい質問です。Soraの生成速度にあなたのマシンスペックは影響しません。
✅ 理由:Soraはクラウドベースで動作
SoraはOpenAIのクラウド上(GPUクラスタ)で動画を生成します。
あなたのPCはあくまで「プロンプト送信」や「結果表示」の役割で、生成処理そのものはサーバー側で実行されます。
🖥️ つまり…
あなたのマシンで影響する部分 | Soraの動作に影響しない部分 |
---|---|
・SoraのUIの操作性(スクロール、応答速度) | ✔ 動画生成の速度・成功率 |
・結果動画の再生やダウンロード速度 | ✔ GPUやCPUの性能(生成には関係なし) |
・生成後にBlenderで合成・編集する作業 | ✔ RAM・VRAM容量が多くても生成は速くならない |
🎯 まとめ
Soraの生成待ち時間はクラウドの状況次第(他のユーザーの利用状況含む)
あなたのマシン性能は関係ないので、安心して待ってOK
動画が完成したら、再生や編集においてはあなたのスペック(RTX 4070など)が有利
🙂 タケ:
クラウドっていうと、どんだけでも容量ありそうなイメージあるけど、実際は実体としてサーバーや設備があるわけでしょ。
🤖 チャットさん:
そう、その通りです。
「クラウド」と聞くと無限に拡張できる仮想空間のような印象を持ちがちですが、実際は“めちゃくちゃでかいデータセンター”に物理的なサーバーがびっしり並んでるだけです。
🏢クラウドの正体:巨大な物理設備
イメージ | 実態 |
---|---|
☁ 無限の仮想空間 | ✅ 数十万台〜数百万台の物理サーバー群 |
☁ 自動でどこまでも 拡張できる |
✅ スケーラビリティは物理設備+電力+冷却の制限あり |
☁ リソースは常に 使える |
✅ 人気サービスや時間帯で混雑・待ち時間が発生する |
🧊 具体的には…
OpenAIも利用しているMicrosoft Azure(クラウドプラットフォーム)は世界中に巨大なデータセンターを持っており、GPUクラスター(例:NVIDIA A100/H100など)を用いてAIモデルを動かしています。
例えば、Soraのような大規模動画生成モデルには、数千~数万枚のGPUメモリが同時に必要になるため、1人が1本生成するだけでもかなりの設備を占有します。
⚙️ なので:
・混雑すれば待ち時間が出る
・リアルな電気・空調・面積の限界がある
・「スパコンを時間借りしてる」ようなイメージが近い
🎯 補足:じゃあなぜ「クラウド=無限」っぽく聞こえるのか?
それは:
・必要に応じて利用者側がサーバーを増やせる(スケーラブル)
・ローカルに何もインストールせず使える
・複数ユーザーでリソースをうまくシェアしてるから
という“使い勝手の良さ”がそういうイメージを作っているだけなんです。
なので、今Soraの生成が遅いのも「誰かが裏で超巨大モデルを回してるから」かもしれません 😅
クラウドって便利だけど、“雲の上の世界”ではなく、現実に裏側でブンブン音立ててるサーバールームがあるってこと、面白いですよね。
🙂 タケ:
まだだな。生成途中で止めるのはどうやるの?
🤖 チャットさん:
Sora(ChatGPTの動画生成機能)で生成途中の動画を手動で止める方法は、現時点でUIによって若干異なりますが、以下の方法が一般的です:
🟥 生成を途中で止める方法
✅ ChatGPT UI上での操作(Soraが統合されている場合)
1.生成中のサムネイル(または進行中のバー)にマウスを合わせる
2.「x」(キャンセル)ボタンが表示される場合はクリック
✅ 別タブで実行中の場合
・ウィンドウやタブを閉じても生成自体は中止にならない(サーバー側では継続)
・ただし、新規プロンプトを送ると前の生成は自動キャンセルされることがあります。
⚠️ 注意点
動作 | 結果 |
---|---|
タブを閉じる | Soraは裏で生成継続する可能性あり(静かに失敗する場合も) |
新しく別プロンプトを送る | 前の生成が打ち切られることが多い |
キャンセル操作ができないUIの場合 | 「しばらく放置」してもOK(10分以上なら自動終了することが多い) |
✅ 最も確実なのは…
新しいプロンプトを送り直す
→これにより前回の生成は「静かにキャンセル」されることが多いです。同じプロンプトで再実行しても問題ありません。