AI推論と訓練:AI推論とは

AIモデルが予測や結論を出すことが、AI推論になります。AIモデルが正確な推論を行えるようにするためのプロセスが、AIの訓練です。

学習目的

この記事を読み終えると、以下のことができるようになります。

  • AI推論の定義と説明
  • AI訓練とAI推論の区別
  • AI推論と訓練で使用される計算能力の比較

記事のリンクをコピーする

AIの推論とは

人工知能(AI)の分野での「推論」とは、訓練された機械学習モデル*が新しいデータから結論を導き出すために使用するプロセスを指します。推論を行えるAIモデルは、望ましい結果の例がなくても推論を行えます。言い換えれば、推論とはAIモデルの動作なのです。

AIの推論の例としては、たとえ走ったことのない道であっても、一時停止の標識を認識できる自動運転車が挙げられます。この停止標識を以前遭遇したことの無い文脈で識別するプロセスが、推論になります。

別の例として、プロスポーツ選手の過去の成績を学習した機械学習モデルは、あるスポーツ選手の契約前に、その選手の将来の成績を予測できる場合があります。このような予測が、推論になります。

*機械学習は、AIの一種です。

AI推論と訓練

  • AIモデルの最初の段階となるのは、訓練です。訓練は、試行錯誤のプロセス、モデルに対し望ましい入力と出力の例を示すプロセス、またはその両方となる場合があります。
  • AIの訓練に続くプロセスが、推論です。モデルがより入念に訓練され、より細かく調整されればされるほど、その推論はより優れたものになります。

機械学習モデルが以前認識したことの無い場所にある一時停止標識を識別できるようになる(あるいはプロスポーツ選手のパフォーマンスを予測できるようになる)には、訓練のプロセスを経ることになります。自律走行車の訓練では、開発者が数千または数百万もの停止標識の画像をモデルに見せています。モデルに基づきそうこうする車両は、(人間のドライバーをバックアップとして)道路を走行したこともあり、試行錯誤しながら学習していきます。やがて、十分な訓練の後、モデルは単独で停止標識を識別できるようになりました。

AIの推論の使用例

実世界でのAIアプリのほとんどすべては、AIの推論に依存しています。よく使われる例として、次のものが挙げられます。

  • 大規模言語モデル(LLM):サンプルテキストで学習したモデルは、以前見たことの無い文字列を解析し解釈できます。
  • 予測分析:モデルが過去のデータで学習され、推論の段階に達すると、入力データに基づいて予測を行えます。
  • 電子メールのセキュリティ:機械学習モデルを訓練することで、スパムメールビジネスメールの侵害攻撃の認識、受信メールメッセージに関する推論、メールセキュリティフィルタにより悪意のあるメールをブロックできます。
  • 運転手のいない車:上記の例で説明したように、推論は自律走行車にとって非常に重要になります。
  • 研究:科学と医学の研究はデータの解釈に依存し、そのデータから結論を引き出すためにAI推論が活用されます。
  • ファイナンス:過去の市場パフォーマンスについて学習したモデルは、将来の市場パフォーマンスについて(確約ではないものの)推論できます。

AIの訓練

AIの訓練とは、AIモデルに大規模なデータセットを与えることになります。これらのデータセットは、構造化されている場合もされていない場合もあり、ラベル付けされていることもあればないこ場合もあります。モデルの種類によっては、インプットとそのアウトプットの具体例が必要な場合もでてきます。ディープラーニングモデルなどの他モデルでは、生のデータだけが必要となることもあります。やがてモデルはパターンや相関関係を認識するようになり、新しい入力に基づいて推論できるようになります。

訓練が進むにつれ、開発者はモデルの微調整が必要になることもあります。最初の学習プロセスの直後に推論を提供させ、出力を修正していきます。あるAIモデルに、ペットの写真のデータセットから犬の写真を識別するタスクを与えたとします。猫の写真であると識別してしまう場合、チューニングが必要になります。

推論と訓練におけるAIの計算能力使用量の比較

AIプログラムは、コンピュータの能力をこれまで以上に拡張します。ただし、従来のコンピュータプログラムと比べ、はるかに大きな処理能力が必要になります。人間にとって、2+2のような単純な計算式に比べ、複雑な数式を解くにはより高い集中力が必要になるのと同じです。

AIモデルの訓練は、計算能力の点で非常に高価になります。しかし、それは多かれ少なかれ一度きりの出費です。一度適切に訓練されたモデルは、理想的にはそれ以上訓練する必要はなくなります。モデルを新しいユースケースに適応させる必要がある場合、開発者は、モデルを一から再トレーニングする代わりに、低ランク適応(LoRA)などのより集中性の低いテクニックを使用することができます。

しかし、推論は継続的に行うものです。モデルがアクティブに使用されている場合、常に新しいデータに訓練を適用し、追加で推論を行っていきます。これにはかなりの計算能力が必要になるため、非常に高価になる可能性があります。

Cloudflareでの開発者によるAI推論の実行

Cloudflare Workers AIでは、開発者によるAIタスクの実行のための世界中のGPUへのアクセスを提供しています。さらに、機械学習モデルの埋め込みを生成・保存するサービスであるVectorizeがこれに加わります。Cloudflareはまた、訓練データの集合を維持するにあたり費用対効果の高いオブジェクトストレージR2エグレス料金無料のストレージプラットフォームも提供しています。

メリットに満ちたCloudflareでの開発者によるAI推論の実行について、詳細をご覧ください。