人工知能の歴史と生成AIの衝撃
1.人工知能(AI)とは
さまざまな定義があり、過去には「100人の研究者に人工知能の定義を聞くと101件の答えが返ってくる」と揶揄されたことがありました。また、時代によってもその定義も微妙に変化しますし、そもそも、世間の認識が研究者のそれとズレることもあります。
ここでは、「人工的につくられた人間のような知能、ないしはそれを作る技術」(松尾 豊.『人工知能は人間を越えるか』. KADOKAWA, 2015, P45. より引用)という定義を提示しておきます。(上述の通り、他にもさまざまな定義がありますが、これは、シンプルで時代の変化に流されることのない表現になっています。)
(余談ですが)
人工知能の定義が難しいのは、それが、一般的に普及し、謎めいた部分がなくなると、人工知能と呼ばれなくなるという側面を持っているからです。
かつては、かな漢字変換やOCR、またコンパイラなども人工知能と呼ばれていたことがあります。
2.人工知能ブーム
図のように、これまでに3度の人工知能ブームがありました。
(松尾 豊.『人工知能は人間を越えるか』. KADOKAWA, 2015, P61. より引用 )
第1次ブーム(1960〜1970年代前半)、第2次ブーム(1980〜1990年代前半)については割愛します。それぞれのブームには象徴的なトピックがある場合もありますが、いつの間にか始まりいつの間にか終わっていて、後から振り返ってそれを認識することになります。ちなみに、第2次ブームは、その直後のITブームと重なっており、うやむやのうちに話題が減っていき気がついたら終わっていたというのが実感でした。
そして、ブームとブームの間には、過酷な冬の時代が存在します。その時期には、人工知能そのものが無かったことにされたのではないかというくらい、冷たい扱いをされました。
筆者自身の体験として、わかりやすいのは書籍の扱いでした。某大型書店での人工知能関連書籍の数が、2020年には本棚2つほど(数百冊)になっていますが、同じ書店の2000年初頭(冬の時代真っ只中)に訪れたときには、十冊程度しかなかったのを確認しています。しかも、広いフロアの隅の方の一番下の棚という目立たないところに陳列されていて、ショックを受けた記憶があります。
書籍がないということは、買う人がいない/出版する人がいない/知識を得る手段がないということですから、研究機関や大学の研究室などがどういう状況に陥っているかは想像に難くありません。
しかし、研究者は細々と研究を続けていきます。そして、その冬の時代を超えて、第3次人工知能ブームが訪れます。
(余談ですが)
1990年台のITブームが来るまでは、書店にはコンピュータ関連のコーナーはありません。人工知能関連書籍は、理工学系の書棚などに配置されていました。冊数としては、シリーズ物などもあったので、数十冊はあったかと思います。
3.第3次人工知能ブームについて
第3次人工知能ブームは、ディープラーニング(深層学習)の誕生がきっかけとなっています。2012年の画像認識大会において高い認識精度が評価されたのです。ディープラーニング自体は2006年にヒントンによって発明されています。
その後にさまざまな分野での活用が行われました。その中でもGoogleの画像認識やDeepMind社が作った囲碁への応用(AlphaGo)などが有名です。
これがどれだけすごいかというと、これまではトイプログラムと笑われていたものが、突然実用レベルの精度になってしまった。技術の進歩が、いきなり10年以上も前倒しになってしまったというようなものです。
AlphaGoがプロ棋士を破った(2016年3月)ことによって、世間にもディープラーニングが浸透していきます。とはいえ、ディープラーニングはそのままでは一般人が使えるようなものではなく、それぞれの問題に対して転移学習という処理を施す必要があります。したがって、研究者から業界関係者に広まったということになります。
そして、それからもさまざまな成果が発表され、シンギュラリティにも言及されるに至り、さらには、(困ったことに)人工知能=ディープラーニングという風潮が広まってしまいました。ディープラーニングは人工知能の一分野である機械学習の一手法になります。しかし、さまざまなところで、人工知能がディープラーニングの代名詞として使われることが増えてしまいました。定義的にどうかという問題は置いておくとして、言語学的には「その表現で皆と意思疎通ができるのであればヨシ」という立場になります。
さて、第3次人工知能ブームの真っ只中にいるのは間違いありません。その一方で、ブームにはいずれ終わりが来るものです。とはいえ、個人的にも会社的にも、状況を調査する能力はありません。そこで、調査会社が無料で公開している情報をもとに推測してみることにしました。
ガートナー社のハイプ・サイクルに於いて「人工知能」という技術がどの位置にいるかをみてみることにしました。ここでの「人工知能」はもちろん「ディープラーニング」の意味です。
下記の図は、2020年にまとめたものに、それ以降の情報を追加したものです。ガートナー社は、関連するハイプサイクルを例年8月〜10月ごろに発表します。
参照:
- Gartner、「日本における未来志向型インフラ・テクノロジのハイプ・サイクル:2024年」を発表
- Gartner、「日本における未来志向型インフラ・テクノロジのハイプ・サイクル:2023年」を発表
- Gartner、「日本における未来志向型インフラ・テクノロジのハイプ・サイクル:2022年」を発表
- Gartner、「日本における未来志向型インフラ・テクノロジのハイプ・サイクル:2021年」を発表
- ガートナー、「日本における未来志向型インフラ・テクノロジのハイプ・サイクル:2020年」を発表
- ガートナー、「日本におけるテクノロジのハイプ・サイクル:2019年」を発表
- 「日本におけるテクノロジのハイプ・サイクル:2018年」で40のキーワードを抽出――ガートナー発表|EnterpriseZine(エンタープライズジン)
- ガートナーが「日本におけるテクノロジのハイプ・サイクル:2017年」を発表|EnterpriseZine(エンタープライズジン)
- ガートナー、「日本におけるテクノロジのハイプ・サイクル:2016年」を発表|EnterpriseZine(エンタープライズジン)
ディープラーニングに対しての過度な期待が薄れて、現実的な判断を行おうとしている状況です。いわゆるブームは終わろうとしているとみることができます。
ただし、世の中的には、ディープラーニングのさまざまな発表が続いていました。そこには、会社を起こしたり、予算を獲得したりといった大人の事情が絡んでいるようです。
そのような、実は終わっているのに、まだ続いているかのような曖昧な状況の中で、2022年11月ついにChatGPTが発表されます。
(余談ですが)
第3次人工知能ブームの最中、2020年1月に開催された人工知能学会主催のシンポジウムを聴講した際、ある違和感を感じました。
画像認識技術は、その視覚的なインパクトと実用性から、発表内容がすぐに理解でき、第3次人工知能ブームの中心となってきました。しかし、そのシンポジウムではBERTを中心とした自然言語処理を前面に出した、人工知能学会会長の講演から始まりました。
BERTが登場したのは2018年10月ですが、それでもなお多くの画像認識関連の成果が報告されており、自然言語処理が中心話題になるほどにはなっていないとの認識でした。また、それまでの自然言語処理はどちらかというと裏方の存在でした。例えば、現在では普通に使用されている日本語入力システムについて考えてみましょう。技術的にはさまざまな要素が詰め込まれていますが、それを「人工知能を使っている」と意識することはありません。自然言語処理はそういう位置付けだったのです。
実際、その数年前に某人工知能研究所の所長に「自然言語処理はどうするのですか」と尋ねたところ、返ってきた答えは「自然言語処理を研究対象には考えていない」というものでした。予算が割かれていないことを示していました。
そんな背景の中で行われた、自然言語処理推しの講演。おそらく、研究者の間では、画像認識技術でできることとできないことが明確になり、その限界が見えてきていたのでしょう。第3次人工知能ブームは終わろうとしている、あるいは、すでに終わってしまったのかもしれないと感じました。そのことを客観的に示すために、上記の図を作成しました。
4.生成AIの衝撃
2020年11月、OpenAIからChatGPTが発表されました。この出来事は、その革新性から多くの注目を集めました。特筆すべきは、ChatGPTがそのまま使える形で提供されたことです。チャット形式のインターフェースを採用しているため、誰でもすぐに質問でき、瞬時に(なんらかの)回答を得ることができます。つまり、技術の恩恵が研究者を飛び越えて一般消費者にまで届けられたのです。
驚くべきことに、ChatGPTは公開後わずか5日間で100万人ものユーザーを獲得し、世の中は一変しました。自然言語処理の研究者たちは、この予想外の進展に混乱しました。実際に、言語処理学会第29回年次大会(NLP2023)では、"ChatGPTで自然言語処理は終わるのか?"という緊急パネルセッションが開催されました。
個人的には、その当時、汎用的な自然言語処理のタスクである不定形メールの定型データ変換を研究していましたが、ChatGPTを使うだけで同等以上の精度が得られることに気づかされました。おそらく、多くの研究者が同様の「それChatGPTでできるよ」状態に陥ったことでしょう。
これは第4次人工知能ブームいっていいのでしょうか?その質問自体がナンセンスかもしれません。これまでのブームとは一線を画した状況だからです。しかし、どう呼ぶにせよ、間違いなく言えることは、ChatGPT以前と以後で時代は区分されるということです。ディープラーニングではこういうことは考えられません。ディープラーニングも一つのブレイクスルーでしたが、ChatGPTほどの衝撃はありませんでした。
技術的な視点では、ChatGPTはtransformerというモデルに基づいて構築されており、BERTなどと同じ技術を使用しています。この意味で、第3次人工知能ブームの延長線上に位置しますが、事前学習データの量が桁違いに多く、そのため性能も格段に向上しているのです。
その影響はただの技術革新にとどまらず、文化や経済にも大きな変革をもたらしました。例えば、即座に高度なテキスト生成が可能となり、マーケティングやカスタマーサービス、教育など多岐にわたる分野で新しい可能性が広がりました。これはただの技術の進化ではなく、新しい価値観の創造に繋がるものです。
結論として、ChatGPTの登場は人工知能の歴史における重要なマイルストーンであり、その影響は今後も広がり続けるでしょう。私たちは、この新しい時代をどう迎え入れるかが問われています。技術の利点を最大限に活かしつつ、適切な倫理や規範を設けることで、より良い未来を築くことが求められるでしょう。
5.汎用人工知能(AGI)を目指して
汎用人工知能(AGI: Artificial General Intelligence)は、人間のように幅広い知識と能力を持つ人工知能を目指したものです。これに対して、現在の大規模言語モデル(LLM: Large Language Models)は特定のタスクで高い性能を発揮しますが、人間のように多岐にわたるタスクを自律的にこなすことはまだ難しいのです。
AGIは、これらの限界を超えて、新しい状況に適応し、直感的な判断を下す能力を持つことを目指しています。単なるデータの集積による推論を超え、環境に対する深い理解と連続的な学習を行うことが求められます。
自由エネルギー原理と能動的推論
自由エネルギー原理(Free Energy Principle)は、AGIの開発において注目される理論の一つです。この理論は、生物が環境に適応するために自由エネルギーを最小化するというものです。これに基づき、AGIは環境からのデータと自身の予測を比較し、その差異を最小化する方向で行動を修正します。これにより、AGIは未知の状況にも柔軟に対応できるようになります。
同じく重要なのが「能動的推論(Active Inference)」です。能動的推論は、自由エネルギー原理に基づいた概念で、エージェントが自身の環境に対する予測を行い、その予測と実際の観測との違い(誤差)を最小化するように行動します。これにより、環境に対する適応力がさらに高まり、自己調整機能を持つAIシステムが実現します。
直感と常識の習得
AGIの開発には、人間のような直感や常識の習得も重要な課題です。人間は経験を積むことで直感や常識を身につけますが、AIにはこれらの機能がまだ欠けています。自由エネルギー原理や能動的推論を活用することで、こうした人間らしい特性をAIに取り入れる研究が進められています。
倫理と安全性
さらに、倫理と安全性もAGI開発には非常に重要なテーマです。AGIが誤った判断を下した場合、その影響は広範かつ深刻であるため、倫理的なガイドラインや安全策の確立が不可欠です。AGIは、人間の指示に従いつつも、倫理的に正しい判断を行うことが求められるため、倫理的な判断や行動を学習する枠組みが必要です。
結論
AGIの実現にはまだ時間がかかるとされていますが、その目指すべき方向性は明確です。AGIが実現することで、人類はさらなる知識の探求や、未知の問題解決に向けた新しい手段を手にすることができるでしょう。AGIが人間と同じように直感や常識を持ち、柔軟に環境に適応し続けることを期待しつつ、倫理と安全性を考慮した開発が不可欠であることを認識する必要があります。
6.まとめ
ChatGPTの登場は、生成AIの新しい時代を切り開き、世界中の人々に驚きを与えました。生成AIは、その汎用性と直感的な操作性から、広範な分野での活用が期待されるようになりました。高度な文章生成や質問応答機能は、マーケティング、カスタマーサービス、教育などさまざまな場面で新しい可能性をもたらしました。
これからのAI技術には期待が寄せられる一方で、その影響力の大きさから倫理や安全性に対する懸念も現実のものとなっています。我々は技術の進化を喜ぶだけでなく、その技術がもたらす影響についても真摯に考え、安全で持続可能な未来を作り出すための取り組みが求められます。AGI(汎用人工知能)の実現が進むにつれ、こうした懸念はますます重要性を増すでしょう。
AIの未来には無限の可能性が広がっています。それは新たな価値を創造し、未知の問題に対する解決策を見つけ出すための大きな力を持っています。私たち一人一人が、この技術の進化と向き合い、その恩恵を最大限に受けつつも、そのリスクと責任を自覚することが重要であると言えるでしょう。
未来のAIがどう進化し、どのように我々の生活を変えていくのか。それは誰にも予測できない壮大な冒険です。しかし確かなことは、AI技術が私たちの未来を形作る重要な要素となり、不可欠なパートナーとして共存する時代が訪れることです。このブログを通じて、皆さまがAIの未来について少しでも考えるきっかけとなれば幸いです。
Biz Freakでは、独自のAIシステムとローコード等のツールを活用して、短期間で最高品質のプロダクトを実装できる能力を養うことができます!
https://bizfreak.co.jp/recruit
(M.H)