生成系AIとは

生成的人工知能(AI)とは、人間が入力した内容を基にコンテンツを生成することができるコンピュータプログラムの一種です。

学習目的

この記事を読み終えると、以下のことができるようになります。

  • 生成AIの定義
  • 生成AIの仕組みを説明する
  • 生成AIの利点と欠点を挙げる

記事のリンクをコピーする

生成系AIとは

生成的人工知能(AI)は、テキスト、画像、コンピュータコード、オーディオビジュアルコンテンツをユーザー入力に応じて生成できるディープラーニングモデルの一種です。

生成系AIモデルは、膨大な量の生データ(一般的には、生成する対象と同じ種類のデータ)を学習データとして使用します。任意の入力が与えられたときにその入力に統計的に関連する可能性が高い応答をそのデータから形成することを学習します。例えば、生成系AIのモデルの中には大量のテキストで訓練され、ユーザー入力に対して一見自然かつ独創的な文章で応答できるようにされているものもあります。

もっと簡単に言うと、生成系AIは要望に対して人間のアーティストや作家のように反応することができますが、より素早く反応することができます。これらのモデルが生成するコンテンツが、「新しい」または「オリジナル」と言えるかどうかは議論の余地がありますが、多くの場合、人間のある種の創造的能力に匹敵するか、それを超えることが可能です。

良く知られた生成系AIモデルには、テキスト生成のChatGPTや画像生成のDALL-Eなどがあります。多くの組織が独自のモデルを構築しています。

生成系AIの仕組み

機械学習、ディープラーニング、ニューラルネットワーク

生成系AIは機械学習の一種で、数学的分析に依存して関連する概念、画像、パターンを見つけます。そして、この分析を利用して、受け取ったユーザー入力と統計的に類似または関連する可能性の高いコンテンツを作成します。

具体的には、生成系AIはディープラーニングと呼ばれる機械学習の一種に依存しています。ディープラーニングモデルは、ラベル付けされていないデータから学習するのに十分強力です。これらはニューラルネットワークと呼ばれるコンピューティングアーキテクチャの一種を使用しています。このようなアーキテクチャは、人間の脳がニューロンを介して情報の受け渡しを行うのと同じように、互いにデータの受け渡しを行う複数のノードで構成されています。ニューラルネットワークを使用することで、高度に洗練されたタスクを実行することが可能になります。

トランスフォーマー(Transformers)と自己注意機構(Self-Attention)

言語を解釈する生成系AIモデルは、個々の単語を超えた理解能力が必要です。文章、段落、文書全体を解釈できる必要があります。初期の機械学習モデルは、文書全体の理解が難しく、文末に到達するまでに文頭部分を「失念」することから、結果として誤解を引き起こしていました。

現代の生成系AIモデルは、トランスフォーマー(Transformers)と呼ばれる特殊なニューラルネットワークを使用しています。これらは、自己注意機構(Self-Attention)と呼ばれる機能を使って、シーケンス内の要素がどのようにつながっているかを検出します。トランスフォーマー(Transformers)により、生成系AIモデルは個々の単語やフレーズだけでなく、より大きな文章のかたまりを処理したり文脈化したりすることが可能になります。

訓練データ

うまく機能させるためには、生成系AIモデルに大量の情報を与える必要があります。ほとんどの場合その情報量は、人間が一生かけて処理できるデータ量を凌ぎます。例えば、大規模な言語モデルであるChatGPTはその学習に、数百万もの文書が使用されています。画像ジェネレーターはその学習に何百万枚もの画像が使用され、コードジェネレーターは何十億行ものコードが使用されます。

この学習データはベクトルデータベースに保存されます。このようなデータベースには、データのポイントはベクトル、つまり多次元フィールド内の座標セットとして保存されます。地図上で緯度と経度から近くの場所を見つけることができるように、データをベクトルとして保存することで、機械学習モデルが「近くの」ポイントのデータを見つけることができるようになります。これによりモデルは、単語、画像、音声、その他あらゆるタイプのコンテンツから連想し、その文脈を理解することができるようになります。

生成系AIモデルが一定の微調整レベルにまで達すると、結果を生成するためにそれほど多くのデータを必要としなくなります。例えば、音声を生成するAIモデルは、何千時間もの発声録音を使用して訓練されるかもしれません。しかし、モデルによっては一度微調整することで数秒のサンプル録音でその人の声をリアルに模倣することができるものもあります。

生成系AIの利点と欠点

生成系AIモデルは、多くの潜在的な利点を提供するため、人気が高まっています。これらの利点の一例を以下に示します:

  • コンテンツのアイデア発想:生成系AIは、コンテンツ制作者がクリエイティブな方向性をより迅速に見出すことを支援します。
  • より優れたチャットボット:チャットボットに生成系AIモデルを組み込むことで、お客様からの質問により的確に答えたり、見込み客を引き込んだりすることが可能となります。
  • 研究の強化:生成系AIモデルは、医療データや科学研究を含む膨大な量のデータを迅速に処理し、研究を支援することができます。
  • 検索結果の改善:検索エンジンとバーチャルアシスタントに生成系AI機能を組み込むことで、問い合わせに対してより迅速に関連情報を提供できるようになります。
  • 娯楽:多くの人が、一般に公開されている生成系AIツールを、単に楽しむためだけに使用することができます。
  • その他の利点:AIは急成長している分野であり、生成系AIがもたらす恩恵はまだまだありそうです。

一方で、生成系AIには次のような欠点があります:

  • ハルシネーション(もっともらしいウソ)やその他の不正確さ:生成系AIモデルはパターンを特定するのが非常に得意である一方、実際には存在しないパターンを特定することもあります。これによりモデルが、誤った情報を提供する「ハルシネーション」(もっともらしいウソ)として知られる現象をもたらす可能性があります。生成系AIモデルは与えられたデータの精度に依存しており、情報源となるデータにアクセスしないと、生成系AIの出力が事実であるか確認することが困難である場合があります。
  • データ漏洩:モデルはプロンプトで入力されたデータを、予期せぬ文脈で公にすることがあります。いくつかの大企業が、このような方法で機密情報やソースコードを不本意に流出させています。
  • 意図しない盗作や知的財産の誤った使用:生成系AIモデルは既存のコンテンツをベースにしているため、コンテンツの原著作者や著作権者の許可なく、与えられたコンテンツを再現してしまう可能性があります。
  • 悪意のある応答操作:攻撃者は生成系AIモデルにデータを送り込むことで、他のユーザーに対して危険または安全でない情報を生成させることができます。
  • バイアス(偏見):学習時にモデルに与えられた情報にバイアスがあると、それを修正するためにモデルを微調整して補正しない限り、そのバイアスが保持されたり色濃くなってしまう可能性があります。それでも、一連の訓練内容全体を見直すことなく、偏見のない結果を保証することは限りなく不可能です。

大規模言語モデル(LLM)とは

大規模言語モデル」(LLM)とは、人間が話す自然な文章とプログラミング言語の両方を含む、言語を処理しテキストを生成できる生成系AIモデルの技術用語です。人気のあるLLMには、ChatGPT(OpenAI製)、Llama(Meta製)、Bard(Google製)、Copilot(GitHub製)、Bing Chat(Microsoft製)などがあります。

AI画像ジェネレーターとは何か?

AI画像ジェネレーターはLLMと似たような働きをしますが、テキストではなく画像を対象としたものです。「DALL-E」と「Midjourney」は、人気のあるAIベースの2大生成画像ジェネレーターです。

Cloudflareは生成系AIの開発をサポートしていますか?

開発者や企業は、Cloudflareで独自の生成系AIモデルを構築することが可能です。Cloudflareは、開発者が自身のデータからCloudflareグローバルネットワーク上にEmbedding(エンベディング)を生成・保存できるVectorizeと、GPUのグローバルネットワーク上で生成系AIタスクを実行するCloudflare Workers AIを提供しています。Cloudflareが次世代の生成系AIをどのように実現するか、詳細をご覧ください。