「2024年度 人工知能学会全国大会 (第38回)」 聴講報告
文字を書くよりコードを書くのが好きで、人工知能がもっと好きな M.H です!
昨今、話題となっている人工知能、その研究者・企業が一堂に会する人工知能学会全国大会が今年もハイブリッドで開催されました。
注目は、生成AI・大規模言語モデル(LLM=Large Language Model:大規模言語モデル)の登場によって、どこまでの影響を受けているかです。
個人的には、昨年は参加できず、2年ぶりの参加なので、発表内容もこれまでと大きく様変わりしていることが予想されます。
現在の人工知能の研究の状況について報告します。
目次
- 大会概要
- 聴講しての感想
- 発表に関する分析
- まとめ
1. 大会概要
- 2024年度 人工知能学会全国大会 (第38回)
- 日程:2024年5月28日(火)~31日(金)
- 会場:アクトシティ浜松(静岡県浜松市) + オンライン(ハイブリッド開催)
- https://www.ai-gakkai.or.jp/jsai2024/
- 会場
- アクトシティは浜松駅に隣接した施設で、すぐ隣にありました。
- 立派な広い施設で、逆に受付の場所を探すのに苦労しました。
- 各講演会場は複数の建物に広く配置されていて、セッションXの発表を聴いて次にセッションYの発表を聴こうとして、会場の移動に5分〜10分かかって聞きそびれることもありました。
- クロージングで発表された参加者数など(大会委員会発表の速報値)
- 発表件数:946件
- 参加者数:3792人(うち現地参加:2893人)
- スポンサー数:113社
2. 聴講しての感想
概観
全体を通して多かったのが、予想通り「生成AI」や「大規模言語モデル」に関わる発表でした。しかし、発表者も急速な「生成AI」の発展についていけていない状況が見て取れました。
実際に、発表論文提出期限(2024/2/12)から大会(2024/5/28)までの間に状況が大きく動きました(5/14:GPT-4o発表、5/15:Google I/O など)。さすがにこれらを考慮していないことを責めるのは酷というものでしょう。
それでも、本来やるべきことを蔑ろにしているように見える場合がいくつかありました。
全体的な印象として、「大規模言語モデルを用いた◯◯」系の発表では、うまくいっていないものが多く感じられました。
本来なら、手法やモデルを比較検討し、そこにアイデアを加えて性能を上げるべきところを、安易に生成AIに置き換えてしまっている場合が見られました。
それでうまくいっていればいいのですが、往々にして期待する結果が得られていません。原因としては、生成AIの位置付けを間違っているのではないかと考えられます。生成AIは要素技術ではなく、出来上がったサービスです。極端なことを言えば、データ分析に検索エンジンを使うと言っているのと同じ発想になります。もしかしたらうまくいくこともあるかもしれませんが、期待しない結果になる場合の方が多いのではないでしょうか。さらに、研究の根幹に関わる部分を置き換えてしまっているので、研究の焦点が見えなくなってしまいます。
また、生成AIでは「同じプロンプトに対して同じ回答をするとは限らない」という点も考慮しなければなりません。この特性があるので、生成AIを要素技術に置き換えても研究成果の再現性は出なくなってしまいます。
その結果、研究報告というよりは、生成AIの性能評価のような発表になっている場合が見受けられました。
これらの様子で既視感があるのが、「Word2vec」や「BERT」が出てきた時です。この時にも、皆がこぞって使うようになり、成果を出している報告がある一方で、とんでもない使い方をしているのを見かけたことがあります。
独自性を出そうとしているのか、あるいは便利なツールが出てきたので便利に使ってみようとしたのかわかりませんが、目的と手法の選択という基本的なところをしっかりしないとトンデモになってしまうというものだと感じました。
もちろん、有益な発表も多数存在します。そのうち注目したものの一部を紹介します。
「物語構造分析に基づくLLMを活用した創作支援を目的とするインタラクティブストーリー生成システム」
「ブラックジャック」の新作のプロット作成を支援したシステムの話でした。
言ってみれば生成AIの入出力を支援するツールです。プロンプトとして表現すべき項目をUIとして設定してパラメータ調整することで、適切なプロンプトに変換し、その出力をわかりやすく表示するものです。
ツール自体はそんなに難しい仕組みには見えませんでしたが、適切な項目の選択やパラメータからプロンプトへの変換など、内部的にはノウハウの塊であろうことはよくわかります。
見た目は単にGPT4にUIをつけたものですが、それらを適切に変換する仕組みがすごい成果だと思います。
「生成AI時代のナレッジグラフ」
ナレッジグラフの研究者によるパネルディスカッションでした。
最初にそれぞれの研究者が立場を表明し、ディスカッションに臨みました。
タイトルが全てですが、生成AIに対してどう位置付けていくかがポイントでした。
各人それぞれの立場・思想はありますが、ナレッジグラフを生成AIと融合して活用していくかという方向性は一致しています。
個人的には、ナレッジグラフには興味があり、期待しています。
生成AIは驚異的な進化を短時間で遂げており、今後も進化していくことが予想されますが、その本質はニューラルネットワークです。
一方で、人間の知識・推論・学習を考えた場合に、論理構造を無視することはできないと思います。ある確定した情報を紐づける。あるいはすでに紐づいているものを利用する。そのために多くの時間を割いて学習するというのは、どうしても考えられません。
もちろん、人間の脳はニューロンで作られたネットワークで構成されているわけですが、その中に論理的に思考する仕組みがあります。
現在のニューラルネットワークにはそれがないように見えます。そしてそれを補うのがナレッジグラフではないかと考えています。
これらがうまく融合することによって、もう一段上のステップに進むことができるのではないかと期待します。
3. 発表に関する分析
2024年度の人工知能学会全国大会の発表内容について、大会サイトのセッション一覧ページをたどってスクレイピングしてデータを収集しました。
次のような収集を行い解析を行いました。
- 一般発表やポスターセッション、招待講演なども含め、1011件を収集
- 英語のみの発表は極力除外
- 企業ブースの説明は除外
- 講演情報のページから次を抽出
- タイトル
- キーワード
- 講演内容のアウトライン
WordCloud
単語数に基づくワードクラウドを作成してみた結果がこちらです。出現数が多い単語が大きいフォントで表示されています。
「モデル」「学習」「研究」「言語」「データ」「生成」「AI」などが出現数が多いことがわかります。
これだけ見ても、生成AI・大規模言語モデルの影響が大きいことが見て取れます。
BERTopicによるトピック分析
12のトピックが抽出されました。
トピックごとの出現単語
全体的に生成AI・大規模言語モデルがあり、そのほかに医療、交通、市場分析、画像、感情、スポーツ、ロボットなどのトピックがあります。
- 医療=Topic3
- 市場分析=Topic4
- 画像=Topic5
- スポーツ=Topic6
- 交通=Topic7
- ロボット=Topic8
- 感情=Topic9
階層クラスタリング
12に分かれていますが、大きく見ると3つか4つにまとまるように見えてきます。こちらでも生成AI関連が大きくなっていることが見て取れます。
0.8のところを目安に見てみると、次のようになっているように見えます。
- (11)+(6) → ロボット
- (8) → スポーツ
- (9) → 感情分析
- その他 → 生成AI・LLM
ドキュメントとトピックの関係、分布状況
講演とトピックの分布関係です。
4. まとめ
全体を通して、生成AI・大規模言語モデルに塗りつぶされてしまったという印象です。もし、「生成AI・LLM学会」だと言われてもさほど違和感を感じないほどです。
しかし、皆が生成AIを研究にうまく取り込んで使いこなせているというわけではありませんでした。むしろ、急激な変化に追いつけていけず困惑しているという様子すら感じられました。
生成AIがゴールというわけではありません。AGI(汎用人工知能)に向かう長い道のりにおける一つのブレークスルーなのではないでしょうか。
一方で、そのほかの個別の研究がかすんでしまったように感じました。
現在の生成AIの躍進は、『冬の時代』にも続けていた研究があってこそだと思っています。今は生成AIほど華々しくもなく目に見える成果もないように見える研究がいつか大きな成果を生み出すかもしれません。
次回の大会では、生成AIを使いこなした研究・発表に加えて、そのほかの研究の巻き返しが多く出てくることを期待したいと思います。
Biz Freakでは、独自のAIシステムとノーコード等のツールを活用して、短期間で最高品質のプロダクトを実装できる能力を養うことができます!
https://bizfreak.co.jp/recruit
(M.H)