最近AI技術の進化により、私たちの日常生活やビジネスにおいても多くの情報が出ていますが、
特にOpenAIが提供するChatGPTは、その最前線に立つプロダクトの一つとして注目を集めています。
今回は、ChatGPT Plusの中でも特に興味深い統合機能として提供されるDALL-E 3に焦点を当てて、その魅力や使い方について解説していきます。
DALL-E 3とは何か、どのような特徴を持ち、どう使うのか、そしてChatGPT Plusに登録するメリットは何か。これらの疑問を解消していきましょう!
ちなみにこの記事の挿入画像やアイキャッチ(テキストはCanva)はDALL-E 3で作成しました。
プロンプトは「タイトルとブログに似合う画像を作ってほしい」という指示です。
合わせてご覧ください
DALL-E 3の歴史と背景
DALL-E 3は、AI技術の研究と開発をリードする企業OpenAIによって生み出された最新の画像生成技術です。
OpenAIはGPTシリーズをはじめとする一連の革命的なAIモデルを開発してきました。
DALL-Eの初代は、GPT-3の技術をベースに、テキストの指示に基づいて画像を生成するという驚異的な能力を持っていました。
その後、OpenAIはDALL-Eの技術をさらに進化させ、DALL-E 3を開発。
前バージョンの能力を継承しつつ、より高解像度の画像生成や多様なスタイルへの対応など、さらに高度な機能を持つようになりました。
DALL-E 3が持つユニークな能力
高解像度の画像生成
DALL-E 3は、高解像度の画像を生成する能力を持っています。これにより、詳細なテクスチャや複雑なシーンの再現が可能となりました。
テキストベースの指示に従った画像生成
「夕日の中の猫」といったテキストの指示に基づいて、それに合致する画像を生成することができます。
これにより、ユーザーの抽象的なイメージやアイディアを具体的なビジュアルに変換することが可能となりました。
スタイルやテーマの適用
特定のアートスタイルやテーマに基づいた画像生成もDALL-E 3の得意とする領域です。
例えば、「ルネッサンス風の風景画」といった指示に応じて、そのスタイルに合わせた画像を生成することができます。
連続的な画像変化の生成
DALL-E 3は、ある画像から別の画像への連続的な変化を生成する能力も持っています。
これにより、アニメーションや変化の過程をビジュアルとして表現することができます。
ChatGPTとDALL-E 3の統合のメリット
「ChatGPT」と「DALL-E 3」共にOpenAIが提供していますが、今回の統合はどのような意味があるのでしょうか
シームレスな操作体験
ChatGPT PlusとDALL-E 3の統合により、ユーザーは一つのインターフェース上でテキストと画像の生成をシームレスに行うことができます。
例えば、テキストでの質問や指示をした後、それに応じた画像を即座に生成するといった流れがスムーズに実現されます。
これにより、ユーザーは複数のツールやプラットフォームを行き来することなく、直感的に操作を進めることができます。
一つのプラットフォームでの多機能利用
従来、テキスト生成や画像生成といった異なる機能は、それぞれ別のツールやサービスで提供されることが一般的でした。
ChatGPTとDALL-E 3の統合は、これらの機能が一つのプラットフォーム上で提供されるようになりました。
これにより、ユーザーは一つのアカウントとインターフェースで、幅広いAIの機能を活用することが可能。
特に、クリエイティブなプロジェクトや研究を行う際に、テキストと画像の連携が求められるシチュエーションが多いため、この統合は大きな価値を持っています。
DALL-E 3使用の注意点
2023年10月現在「DALL-E 3」の利用は、ChatGPTの有料版「ChatGPT Plus」契約者のみです
ChatGPTの有料版についてはこちらの記事を参考にしてください
-
ChatGPT無料版と有料版の違い。登録について
ChatGPTとは、OpenAIという会社が作ったコンピュータープログラム。 チャットで質問に答えたり、問題を解決する手助けをしたりします。 ChatGPTで ...
続きを見る
暴力的な内容や成人向けの内容、あるいは憎悪に満ちたコンテンツを生成する能力に制限あり
OpenAIはDALL-E 3について、暴力的、憎悪に満ちたもの、ヘイトを生むもの、成人向けの内容やコンテンツを生成する能力に制限をかけていると述べています。
さらに、生存するアーティスト、公人や著名人の名前による画風を求めるリクエストを拒否するように設計されているそうです。
クリエイター自身も、自分の作品がモデルの訓練に使われないよう除外する要求(オプトアウト申請)できます。
商用利用は可能
生成AIツールで作成した画像は商用利用不可のものが多いですが、
DALL-E 3で生成した画像はユーザーのものとし、OpenAIの許可なく転載・販売等の商用利用が可能とされています。
画像はPNG形式
ダウンロードできる画像の形式はPNGになります。生成された画像にカーソルを合わせるとダウンロードマークが表示されるので、クリックするだけでダウンロードが開始します。
DALL-E 3の使い方
ここからは実際に使い方について説明します。
ChatGPTを開き[GPT-4]を選択すると、このように[DALL-E 3]と表示されています。
DALL-E 3は順次導入されるようで、[GPT-4]使用時にDALL-E 3の項目が増えれば使えるようになります。
実際に使い方は聞いてみました。
Q,プロンプトの入力はここでするのですか?
いつものChatGPTの使い方と同じです。そこに画像生成のためのプロンプトを入力するだけ
他にも質問した気になることをまとめると
- プロンプト(指示テキスト)は日本語でもOK
- 画像の内容、シーン、オブジェクト、色、スタイルなど、できるだけ詳しく説明する
- 箇条書きでなくてよい、特別な記号はない
試しに以下の文章でお願いしてみました
[オレンジシャーベット色の空、エメラルドグリーンの海、イルカが飛んでいる。遠くに船が見える]
生成途中
英文にして作成してくれています。ここで絵のタイプも写真、イラスト、ベクターなど指示してくれてます。
短い文章でもさらに設定を追加してくれるようです
生成結果
絵のタッチまで指示は出していませんので、いろんなテイストの画像になりました。
他の画像生成AIの場合、これぐらいの文章だとあまり再現率が良くないのですが「DALL-E 3」は思ったより形にしてくれたという印象です。
ここで画像比率が気になったので聞いてみました
その場で質問しながら画像が作れるのも大きなメリットだと思います。
せっかくなので、比率変更と修正をお願いしてみました
[縦長(1024x1792ピクセル)でお願いします。海の色を水色に変えてください]
生成結果
絵の作りは全く同じではありませんが、大きな変化はなく修正してくれました。
まとめ
「DALL-E」を使ったのはこれが初めてだったので、まだこれからいろいろ試してみようと思いますが、1回目の使用でAdobe fireflyよりは短文でも形になったなという印象
ブログ作成も文章と挿入画像をいっぺんに作れてしまうかもしれない。
ChatGPTの有料版での利用ということで月額20$掛かりますが、画像生成AI単体の利用に有料課金するよりは、ChatGPTの有料版も使えて画像も生成できるという意味でお得ではないかな?と思いました。
無料で「DALL-E 3」を使いたい方は、Microsoftの画像生成AI Bing Image Creatorでも「DALL-E 3」で画像生成ができるようになりました。
商用利用できないなど制限はありますが、まずは試してみたい、楽しみたいという方はこちらをお勧めします。
まだまだ変化していくと思いますので追記で更新していきたいと思います。
●その他の画像生成AIツール●
Adobeの画像生成AI「FireFly」
-
Adobeの生成AI 「Firefly」概要・実際に使ってみた
今日はAdobeが新たに一般提供を開始した生成AI、Firefly(ファイアフライ)について深掘りしていきます。 この革新的な技術は、画像生成からテキスト効果、さらには色の ...
続きを見る
ChatGPTおすすめ書籍
基本的な使い方や仕事での活用例で学べる1冊
AI初心者はこの本から!
ChatGPTはもちろん使えるツール100選やプロンプトなど盛りだくさんで知ることができる1冊
AIを用いて個人が稼ぐ方法。ブログ初心者にも有益