生成AIとは何か、文章作成や画像生成をどのように行っているのかを、看護師向けにやさしく解説!書籍『ChatGPT使ってる?ナースが書いた 看護に役立つ生成AI使いこなし術』の試し読み記事をお届けします。

AIと生成AIの違い

 前項(書籍参照)では、私たちが気づかないうちに、日常的にたくさんのAI技術にふれていることを確認しました。スマートフォンの音声アシスタント、予測変換、ネットのおすすめ機能、迷惑メールフィルターなど―。これらは、私たちの言葉を「認識」したり、次に起こることを「予測」したり、情報を「分類」したりすることで、私たちの生活を便利にしてくれる、いわば“賢いお手伝いさん”のような存在でした。

 では、本書のテーマである「生成AI」は、これらのAIといったい何が違うのでしょうか?

 その鍵を握るのが、まさに「生成(せいせい)」という言葉の意味にあります。「生成する」という言葉を辞書で引くと、「(新しいものが)生じ出ること。また、生み出すこと」といった意味が出てきます。つまり、ChatGPTをはじめとする「生成AI」とは、おおまかにいえば、何か新しいものをゼロから生み出す(創り出す)ことができるAIということなのです。

1.AIは受け身的に働く

 「え? AIが何かを創り出す?」と、少し不思議に思われるかもしれません。
 先ほど挙げた身近なAIたちを思い出してみてください。彼らの仕事は、基本的には「すでに存在するもの」を扱うことが中心でした。例えば、迷惑メールフィルターは、送られてきたメールが「迷惑メール」か「そうでないか」を分類します。 音声アシスタントは、私たちの話した言葉が「どのような意味か」を認識し、既存の機能(天気予報を表示する、アラームをセットする)を実行します。 おすすめ機能は、過去のデータに基づいて、私たちが次に好みそうなものを予測し、推薦します。 予測変換は、次に入力されそうな単語を予測して提示します。

 彼らは、何かまったく新しい文章や画像、音楽などを自ら「創り出している」わけではありません。与えられた情報や状況を理解し、それに対して最も適切と思われる既存の答えや動作を返す、というのが主な役割だったのです。これを専門的には「識別系AI」や「予測系AI」などと呼んだりもしますが、難しい言葉はいったん置いておきましょう。大切なのは、彼らが主に「受け身」で、既存の枠組みのなかで働いていた、というイメージです。

2.生成AIは能動的に働く

 一方、生成AIはもっと「能動的」です。まるでアーティストや作家のように、指示(命令)に従って、これまで世のなかになかったかもしれない、まったく新しいコンテンツを創り出すことができるのです。

 例えば、あなたが「夕焼け空を飛ぶ猫の絵を描いて」と生成AIにお願いしたとします。 すると、 生成AIは、 学習した膨大な画像データ(空の画像、猫の画像、絵画のスタイルなど)を基にして、あなたの指示に沿った世界に1枚だけの「夕焼け空を飛ぶ猫の絵」を新しく描き出してくれます。それは、インターネットのどこかから既存の猫と夕焼けの写真をコピーして貼り合わせたものではありません。学習した無数の要素を組み合わせて、創造的に生み出された、オリジナルの(といえるかは議論がありますが)絵なのです。

 また、生成AIは文章を作るのも得意です。あなたが「患者さん向けの、高血圧の食事療法のポイントをまとめた、やさしい口調のブログ記事を書いて」と指示すれば、生成AIは学習した医学情報やブログ記事の書き方などを駆使して、あなたのリクエストに合った、まったく新しいブログ記事をゼロから書き上げてくれます。これも、どこかのウェブサイトから文章を丸ごとコピーしてくるわけではありません(もちろん、学習データの影響は受けます)。

 ほかにも、作曲をしたり、プログラムのコードを書いたり、企画のアイデアを出したりと、生成AIが生み出せるものは多岐にわたります。まさに、“デジタル世界のクリエイター”と呼べるような存在なのです。

3.「料理評論家・敏腕ウェイター」と「凄腕シェフ」で考えてみる

 ここで、少し料理に例えてみましょう。
 これまでのAIが、特定の料理(例えば、カレー)がおいしいかどうかを判定する「料理評論家」や、あなたの過去の注文履歴から「次はきっとラーメンですね?」と予測する「敏腕ウェイター」だとすると、生成AIはさまざまなレシピや食材の知識を徹底的に学んだ「凄腕シェフ」のようなものです。

 あなたが「冷蔵庫にある鶏肉と野菜を使って、何かピリ辛でご飯が進む、新しい料理を作って」とオーダー(指示)すると、そのシェフ(生成AI)は、学んだ知識と技術を総動員して、今までにないオリジナルの創作料理(新しいコンテンツ)を「生成」してくれる、そのようなイメージです。

生成AIのシェフのイメージ

【無料webセミナー配信中】Chat GPTとは?看護に役立つ生成AIの基本と活用術

生成AIはデータ学習から何かを生み出す

 もちろん、生成AIが魔法のように、何もないところから完全に独創的なものを生み出しているわけではありません。その力の源泉は、やはり「学習」にあります。人間がこれまでに創作した膨大な文章や絵、音楽、プログラムコードなど、ありとあらゆるデータを学習することで、その背後にあるパターンやルール、スタイルといったものを、人間には到底真似できないレベルで吸収しています。

 そして、私たちが「こんなものを作って」と指示(これを「プロンプト」と呼びます)を与えると、AIはその学習した膨大な知識のなかから、指示に関連するパターンや要素を巧みに組み合わせ、統計的に“それらしい”と判断される、新しいアウトプットを生成するのです。

 ですから、生成AIが生み出すものは、ときどきどこかで見たような要素の組み合わせに見えたり、私たちの期待とは少し違う、ちぐはぐなものができ上がったりすることもあります。完璧な創造主ではなく、あくまで学習データに基づいて“それっぽく”創り出している、というのが現時点での実態に近いでしょう(このあたりの限界や注意点については後述します)。

 それでも、この「ゼロから何かを生み出す」能力は、これまでのAIにはなかった、非常に画期的でパワフルなものです。だからこそ、今、世界中でこれほど大きな注目を集め、私たちの仕事や生活に大きな変化をもたらす可能性を秘めている、といわれているのです。

 つまり、これまでの身近なAIは、 主に「認識」「予測」「分類」といった能力で私たちをサポートしてくれました。 それに対して生成AIは、学習した膨大なデータをもとに、指示に応じて、文章、画像、音楽、コードといった、新しいコンテンツを「生成(創造)」する能力をもっています。

 この「生成する力」こそが、生成AIを特別な存在にしている核心部分です。では、いったいどうやって、AIはこんなにも複雑な「生成」能力を身につけることができたのでしょうか? その秘密は、やはり「学習」の方法にあります。
 次項では、生成AIが膨大なデータからどのように知識を吸収し、新しいものを生み出す力を獲得していくのか、その学習のしくみについて、もう少しだけ踏み込んでみていきましょう。

POINT

●生成AIは指示(プロンプト)に従って、既存ではない新たなコンテンツを創り出すことができる。
●現時点では、生成AIの創造はあくまで膨大な学習データに基づき、指示に近い形で創り出している状態である。

大量のデータで賢くなる?生成AIの学習のしくみ

 前項では、生成AIがまるでアーティストや作家のように、指示によって新たな文章や絵などを「 ゼロから生み出す」力をもっていることをみてきました。まるで魔法のようにも思えるこの能力ですが、もちろん、AIが本当に魔法を使っているわけではありません。その驚くべき力の源泉は「学習」にあります。

 では、AIはいったいどうやって、そのように複雑な「生み出す力」を学習しているのでしょうか?まるで人間の赤ちゃんが言葉を覚えたり、芸術家が表現方法を身につけたりするようなプロセスを、AIはどうやって実現しているのでしょう? その秘密の鍵は、私たちの想像をはるかに超える、とてつもなく膨大な量の「データ」にあります。

 生成AIを賢くするための「教科書」や「先生」となるのは、インターネット上に存在する、ありとあらゆるテキスト(ウェブサイトの記事、ニュース、ブログ、書籍、論文など)、数えきれないほどの画像や写真、膨大な量の音楽データ、そして世界中のプログラマーが書いてきたプログラムコードなど、まさに人類が生み出してきたデジタル情報の集大成ともいえるものです。その量は、私たちが一生かかっても読みきれない、見きれないほどの、天文学的な規模になります。

 『AI 2041 人工知能が変える20年後の未来』(カイフー・リー、チェン・チウファン著)には、「GPT-3(2020年)のデータセットを、もし生身の人間が読んだら、一生の50万倍の時間がかかるほどの量を学習している。そして、このデータ量は毎年10倍ずつ増えている」1)と書かれています。AIは、私たちが一生かかっても読み切れない量のデータを学習しているのです。

 生成AIは、この膨大なデータをいわば「お手本」として、ひたすら読み込み、解析していきます。しかし、ここで重要なのは、AIが人間のように文章の意味を深く「理解」したり、絵を見て感動したりしているわけではない、ということです。AIが行っているのは、もっと数学的、統計的な作業です。
 それは、データのなかに潜む、無数の「パターン」や「ルール」「関係性」を見つけ出し、それを記憶していくというプロセスなのです。

生成AIの学習のイメージ

文章作成を学習するプロセス

 例えば、文章作成を学習する場合を考えてみましょう。

1.次に来る単語予測を繰り返す

 最も基本的な学習方法の1つは、「次に来る単語を予測する」という、一見シンプルな作業の繰り返しです。 AIに、例えば「明日はきっとよい〇〇になる」という文章の一部を見せます。そして、「〇〇に入る確率が最も高い単語は何でしょう?」と問いかけるのです。

 AIは、これまでに学習した膨大な文章データのなかから、「明日はきっとよい」というフレーズの後に続く言葉として、最も頻繁に現れる単語を探します。その結果、「天気」という単語が非常に多く使われていることを見つけ出すでしょう。一方で、「冷蔵庫」や「電柱」といった単語が続くことは、まずあり得ないことも学習します。

 AIは、このような「次に来る単語の予測」クイズを、文字どおり何十億回、何百億回と、途方もない回数で繰り返します。「猫は〇〇の上で寝ている」→「(おそらく)マット」「看護師は患者さんの〇〇に寄り添う」→「(おそらく)気持ち」「〇〇を食べたら、おなかが痛くなった」→「(おそらく)古いもの」というように、この地道な予測トレーニングを延々と続けるうちに、AIは単に「次に来る単語」を当てるだけでなく、もっと複雑なことを学習していきます。

2.文法や文章の構造を膨大なパターンでとらえる

 例えば、「てにをは」のような日本語の文法ルールや、「主語の後には述語が来やすい」といった文章の構造、さらには、「“うれしい”という言葉の後には、ポジティブな内容が続くことが多い」「“しかし”の後には、前の文と逆の内容が来やすい」といった、言葉と言葉のつながりや文脈(コンテクスト)まで、統計的なパターンとしてとらえていくのです。

 これは、まるで私たちが子どものころ、まわりの大人の会話をたくさん聞いたり、絵本を読んだりするうちに、文法を誰かに教わらなくても、自然と正しい日本語を話せるようになるプロセスに似ているかもしれません。たくさんの「お手本」にふれることで、その言語がもつ暗黙のルールやニュアンスを、体で覚えていくような感覚です。AIは、それを人間とは比べものにならないほどのデータ量とスピードで実行しているのです。

画像生成を学習するプロセス

 画像生成AIの場合も、基本的な考え方は似ています。
 AIは、例えば「猫」というラベルが付いた何百万枚もの猫の画像と、「犬」というラベルが付いた犬の画像をひたすら見続けます。その過程で、「猫には、とがった耳とひげがあって、丸い目が多いな」「犬は、猫とは鼻の形が違うな、尻尾を振ることが多いな」といった、「猫らしさ」「犬らしさ」を構成する視覚的な特徴やパターンを、ピクセル(画像を構成する小さな点)のレベルで学習していきます。
 
 さらに、「青い空」「緑の草原」「木造の家」といった、さまざまな物や背景の画像も大量に学習し、それらがどのように組み合わさって1枚の「絵」や「写真」になっているのか、その構成パターンも吸収していきます。

学習パターンを組み合わせるプロセス

 このようにして、膨大なデータのなかから、無数のパターンや関係性を抽出し、それを内部に巨大な「知識マップ」のような形で蓄積していく―。これが、 生成AIの基本的な学習のしくみです(実際には、もっと複雑な数学やアルゴリズムが使われていますが、ここでは「超入門編」として、このイメージをもってもらえれば十分です)。

 そして、この知識マップが完成すると、AIは新しいものを「生成」する準備が整います。私たちが「こういう文章を書いて」「こんな絵を描いて」と指示(プロンプト)を与えると、AIはその指示を解釈し、蓄積された知識マップのなかから関連するパターンを検索し、それらを最も「それらしい」確率で
組み合わせて、新しい文章や画像を生成するのです

 ですから、生成AIの答えはいつも同じとは限りません。同じ指示を与えても、確率的な組み合わせ方によって、少しずつ異なるアウトプットが出てくることがあります。また、学習データに偏りがあれば、生成されるものにも偏りが生じることがありますし、学習データにない、まったく新しい概念を生み出すのは苦手です。あくまで、学習したパターンの範囲内で、それらを巧みに再構成している、という側面が強いのです。

 それでも、この「大量データからのパターン学習」によって、AIが人間顔負けの(時には人間を超える)文章や絵、音楽などを生成できるようになったことは、驚くべき進歩です。

 さて、ここまでで「生成AIとは何か」「どのように学習するのか」という基本的な部分をおさえました。生成AIの教科書となるのは、インターネットなどに存在する膨大なデータです。では、この膨大なデータを学習した結果、具体的にどのような種類の生成AIが登場し、それぞれどのようなことがで
きるのでしょうか?
 次項(書籍参照)では、代表的な生成AIの種類と、その特徴についてみていきましょう。

POINT

●生成AIは、膨大なデータのなかから、無数のパターンやルール、関係性を抽出し、それを内部に巨大な知識マップのように蓄積して学習する。
●指示(プロンプト)を与えると、指示を解釈して蓄積された知識マップのなかから関連するパターンを検索し、それらを最も“それらしい”確率で組み合わせて、新しい文章や画像を生成する。

1)カイフー・リー,チェン・チウファン:AI 2041 人工知能が変える20年後の未来.中原尚哉訳,文藝春秋,東京,2022:158.

\続きは書籍で/

生成AI書籍表紙

ChatGPT使ってる? ナースが書いた
看護に役立つ生成AI使いこなし術

上川重昭 著
A5・128ページ
定価:1,980円(税込)
照林社

無料webセミナー配信中

本書の出版記念セミナーをエキスパートナースweb会員限定で公開!
著者の上川先生が、生成AIの基礎知識や活用術、注意点をわかりやすく紹介しています。
詳細は下記ページをご覧ください。
【無料webセミナー配信中】Chat GPTとは?看護に役立つ生成AIの基本と活用術

当サイト内の文章・画像等の内容の無断転載および複製等の行為を禁じます。