前回に引き続き、Perplexity AI徹底活用応用編Vol3という事で、Perplexityを使って慣れてきた人に対して、「画像生成」機能について詳しく紹介していきます。
Perplexityはなかなかに奥が深い、面白い機能がどんどん増えていっていますよ。
では、ぜひ最後までお付き合いしていただけると幸いです。
画像生成機能の活用
Perplexity AIの有料版では、Stable Diffusion XLやDALL-E 3などの画像生成モデルを使用できます。これを活用することで、プレゼンテーション資料の図表作成や、商品イメージの具体化など、ビジュアル面での創造的な作業をAIにサポートしてもらうことができます。
機能の特徴
- 自然言語での指示で複雑な画像イメージを表現可能
- 4種類のスタイル指定で、簡単に画像生成が可能
Perplexityで生成した画像の注意点
はじめにPerplexityの利用規約では、生成した画像の利用は個人的かつ非商業的な用途に限定されています。
画像生成機能は有料プランで利用可能ですが、生成された画像は個人使用のみに制限されており、商用利用は許可されていません。
商用利用での利用の場合は、商用利用可能な別の生成AIツールを使用することをお勧めします。
- 1日に生成できる画像数は50枚まで生成可能。
- 生成された画像は個人的な非商用利用に限定されています。
- 1度に1枚の画像生成
基本的な使い方
画像生成は、検索がメイン機能のperplexityなので、検索結果を元に画像を生成することが可能です。
資料のイラストや、図表を生成して、挿絵として使う利用方法を想定していると思います。
1.まず、通常と同じ様にPerplexityで検索(プロンプト入力)を行います。
今回は「Google Pixel携帯シリーズのサポート期限について」を入力してみました。
Pixel携帯シリーズについての検索結果が返ってきます。
検索結果が表示された後、画面右側に「画像を生成する」というオプションが表示されます。
2.右の「画像を生成する」をクリックする
スタイルを選択する画面が表示されます。
このまま「絵画」「写真」「イラスト」「図表」のスタイルを選択すると即時に画像を生成することが出来ます。
今回は「図表」を選択してみました。
挿絵としては、まずまず問題ない感じですよね。
画像生成プロンプトを直接設定したい場合
画像生成は、検索がメイン機能のperplexityなので、検索結果から画像を生成するという少々トリッキーなインタフェースです。
ちょっとイメージと違うなという場合も、プロンプトを直接指定して画像することが出来ますよ。
1.まず、通常と同じ様にPerplexityで検索(プロンプト入力)を行います。
今回は「登山家が富士山登山」を入力してみました。(ここのプロンプトは何でも良い)
検索結果が表示された後、先ほどと同じ様に画面右側に「画像を生成する」というオプションが表示されます。
2.右の「画像を生成する」をクリックする
スタイルを選択する画面が表示されます。
今回は直接プロンプトを指定しての画像生成を行いたいと思いますので、
右上のスパナアイコンをクリックします。
3.カスタムプロンプトを設定
スタイルを選択する画面が表示されます。
AIに伝えるプロンプトを「スタイル」と、「主題」という形で設定し、「送信」をクリックします。
今回AIに指定したプロンプトは以下のような感じです。
スタイル
「リアルで臨場感のあるフォトリアリスティックなスタイルを採用します。寒冷地の過酷さを伝えるため、吹雪や曇天の空、凍えるような寒さが伝わる色使い(青、白、グレーの寒色系)を表現します。登山家たちのカラフルな防寒着(赤、青、黄色など)は自然の厳しさの中で鮮やかなアクセントを生み出します。」
主題
「冬の富士山を登る登山家のパーティーの情景を描写します。彼らは厳しい気象条件の中、雪と氷に覆われた急な斜面を慎重に登っています。険しい自然環境と人々の挑戦の姿が際立つ、ドラマチックな瞬間を切り取ります。」
なかなか険しい冬山登山との画像になったのではないでしょうか。
気に入らなければ、プロンプトを再度一からプロンプトを設定する必要があるので、
あらかじめプロンプトをテキストエディターなどで作っておくのがオススメです。
それと、1度に1枚しか画像生成できません。他の画像生成AI同時に複数枚生成できるので、ちょっともどかしいですよね。
画像生成モデルの選択(PRO版のみ)
プロンプトだけではなく、お好みで使用する生成AIを選択することも可能です。
左下の「歯車」アイコンをクリックして、設定画面を開きます。
その中の「画像生成モデル」を選択することで、使用するAIを変更することが可能です。
PRO版ユーザーは、設定画面から以下の画像生成モデルを選択できます:
- Playground V3:AIによる迅速なデザイン生成と高度なテキスト理解力を持ち、複雑なプロンプトにも対応可能
- DALL-E3:ChatGPTと統合され、高精度な画像生成と多様なスタイル対応が可能
- FLUX.1:高品質な画像生成能力と優れたプロンプト対応力を持ち、多様なモデルバリエーションを提供
まとめ
生成される画像は、AIを選ぶことでかなり気に入った画像を生成できると思います。
既に有料会員になっているなら、せっかくなので使いこなしてみたい機能ですが、
正直1プロンプトで1画像生成ですので、思ったような画像を生成するのにかなりの時間を要してしまうのではないでしょうか。
この機能はおまけ程度で考え、本格的な画像生成は他の専門の生成AIを利用するのがおすすめとなります。
今後の機能拡張を期待したいところです。
コメント お気軽にコメントをお願いします。