3度あったAIブームとチャットボット

椎名(以下、敬称略)
私はコンサルティング会社を経営していますが、最近、AIのコンサルティング案件が増えました。さらに、AIやIoTなどに関するスタートアップの企業支援が多くなっています。AIの研究もしておりましたので、本日モデレーターを務めさせていただきます。

実は、AIには3度もブームが訪れています。第1次が1960年代の「探索・推論の時代」、第2次が「知識の時代」です。いまは第3次の「機械学習の時代」といわれています。これはディープラーニングがブレイクスルーを起こしたといっても過言ではありません。応用エリアが飛躍的に拡がり、囲碁や将棋、ゲームなど対戦型のゲームでは圧倒的に人間よりもAIが強くなりました。

画像分野でもAIは圧倒的なパワーを示しています。羽田空港の入国審査は、かつての指紋認証に替わって、現在は完全にパスポートの写真による顔認証です。間もなく出国審査も完成します。「Pay Per Laugh」という笑った回数だけチャージする喜劇劇場のようなビジネスや、レントゲンの読影技術など医療分野で医師を支援しています。

一方、言葉の学習では、星新一賞にAIによって書かれたショートショートが入賞しました。現在は断念していますが、AIで東大合格をめざす試みも行われました。現代文の理解や規則性の類推に関しては、AIは苦手のようです。古くは「チューリングテスト」がありました。70年前の話です。

最近では、チャットボットがトレンドになりました。事例のひとつとして、アスクルではLOHACOというチャットボットを稼働しています。導入により顧客満足度が上がり、問い合わせ全体の3分の1がチャットになりました。そのうち4割をチャットボットのマナミさんが対応しています。

チャットボットの利点は「1 on 1」の対話で音声認識が不要なこと、想定問答集(FAQ)が作りやすいこと、会話自体をチャットボットがリードしたり質問形式の選択肢を作ったりすることで、お客さまの要望を満たすことができることです。特にクレーマーの対応に効果的です。実験的に人間のオペレーターとチャットボットの両方に対応させたところ、クレーマーがAIエージェントに親近感を持つことができました。

しかし、チャットボットは言葉の意味を理解していません。基本的には人間の用意したシナリオやデータで会話をします。本物の対話では、話の構造や文脈、意図、感情などのバックグラウンドを理解しなければなりません。「AIが人間と対話する上で必要なものは何か?」「AIはこころをもつことができるのか?」ということをテーマに、ディスカッションを進めていきたいと思います。

AIは言葉の意味を理解できるのか

―現在のチャットボットは意味を理解しているのでしょうか?

石井 導入実績のあるわれわれとしては「現在のチャットボットは、残念ながら言葉の意味を理解するレベルに至っていない」という見解です。しかし業界を問わず、最近では鉄道などインフラ系の企業でよく導入されています。活用方法として増えてきたことは、業務フローの自動対応です。しかし、クレーム対応は人がサポートしています。チャットボットとオペレーターの組み合わせです。

―AIに意味の理解を導入するには、どうすればよいのでしょう。

松尾 意味の理解は「身体性」からアプローチしないと無理ですね。人間が言葉を理解するにあたって、赤ちゃんのときから見たり触って壊したりしながら、外界の概念を獲得していきます。そして、抽象概念や社会的な概念などが構築されます。意味の理解はハードルが高く、技術的には大変です。

―そうなるとデータのポジショニングが重要ですね。榮藤先生、翻訳では、どのようなデータが重要になりますか?

榮藤 GAFA(Google、Amazon.com、Facebook、Apple)はホリゾンタルで攻めていす。しかし、会社の議事録や製薬会社の特許のデータはありません。バーティカルに攻めていくことがわれわれにできることかな、と思っています。しかし、これから2年で何が起きるか分かりません。いちばん怖いのはGoogleの転移学習のような技術です。

現在、画像であれば数サンプルあれば認識が可能です。私の元部下は、ラーメン二郎の店を当てるAIを数十サンプルで作りました。AIの素人が3時間ぐらいで、そんなAIを作れてしまうんです。このような簡易さが言語の世界に入ってくると変わります。コモディティ化もどんどん進んでいきます。

翻訳の場合、直訳はできますが、京都弁のような言葉は翻訳できません。この翻訳には意味が必要になります。要約も同じです。戸田奈津子さんのような要約はできないですね。

だからAIに五感が必要なんですよ。五感を総動員して何が言いたいか、理解するという。

―ということは、京都弁の言葉の背後に潜んでいる真意を教えてくれるようなツールが必要ということですか。

出井 いや、真意まで汲み取るのはAIには無理だね。人間だってそう簡単じゃないんだから。

松尾 京都弁は極端な例だと思いますが、「塩を取ってもらえますか?」と聞くときに「can you」を使うことが日常表現に多くあります。何を求めているのかを判別して対応できればいいのでは。

―翻訳ができるとチャットボットの世界が拡がって、どんどん変わってくるのかな、と思うのですが。

石井 コールセンター業界では、多言語を話せるオペレーターの需要が増えています。2020年の東京オリンピックを契機に、その傾向は続くでしょう。ところが人件費のコストが高すぎて対応できていません。また2020年を考えたとき「119」で救急車を呼ぶような場合ひとつを考えても、「助けてくれ!」を伝えようとしたときに大変なことになるんじゃないか、と。翻訳のニーズは高いです。

個人的には、海外に行っているときのメンタリティで、中南米の人たちは文法無視でも積極的に意思を通そうとします。日本人はそうではありません。しかし、完璧な機械翻訳ができれば、日本人の戦闘能力を高めることができます。

―人と機械のインターフェースは今後どうなるでしょう?

石井 数年前まではブラウザベースのチャットでした。最近はLINEなどのSNSが多くなりました。いずれにしてもテキストで、いわゆる吹き出しのコミュニケーションがほとんどですね。最近、企業のお客さまから言われているのは、スマートスピーカーで問い合わせを受けられないか、という音声認識による言語処理です。いまモビルスでチャレンジしているのは電話ですね。公衆網から入ってきた音声をテキストに変換することで、チャットボットを音声で対応させます。その先にVRやARがあるでしょう。

技術とビジネスで求められる「データの価値」

――ゲームの世界ではVRAR、音声が使われていますが、どういう世界が生まれるでしょうか、出井さん。

出井 いまゲームの多くは若者向けです。ずっと家の中にいて、ゲームをするのではなく、ゲームがきっかけとなり外に出ていき、いろいろな体験をしてそこにコミュニケーションが生まれるのであれば、それは、全く新しいものでありゲームとは別の名称を付ける方がいいかもしれません。そういったことも踏まえ、VRやARさらにAIなどの技術がさらに進歩すると、エンターテイメントの新産業ができると考えています。

1年半も経てば、スマートフォンは5Gになります。そこにAIが入ると新しいインターフェースになり、新しい産業が生まれます。

AI技術の進歩を理解してビジネスモデルを考えることは、かなり面白いと思うんだけどなあ。新しい技術を追いかけるだけでなく、その技術を活用したビジネスを、「現在できること」「将来可能になること」のレイヤーで考えなきゃいけない。

ソニーは、「耳」と「眼」を使う製品だけで技術の進歩とともに大きなビジネスになりました。最近は、進歩のスピードが速くて、プロダクトをつくりビジネスに発展させる暇がないくらいです。その辺りは榮藤先生、松尾先生、いかがですか?

松尾 おっしゃる通りで、技術の進歩がめちゃくちゃ速いので追いつくだけで大変という現状です。けれどもビジネスに展開するときに、データを集める大変さ、販路の開拓などが入ってくるので、そのときにビジネスのスピードが遅くなります。現実的には意外に時間がかかるものかな、と。それがチャンスです。

ところで、出井さんに訊いてみたいのですが、トランジスタの時代にはどうでしたか?
技術の進展を先まで読んでいて、その上でアプリケーションや生活の変化を考えられていたのか、段階的に考えられていたか、関心があります。

出井 僕が高校生の時に行った早慶戦の会場でソニーのトランジスタラジオを見た。大きかったそれまでのラジオからかなり小型化されて、これはすごいな、と驚いたことがきっかけで、ソニーに入社したいと思いました。その頃のトランジスタは、6石ぐらいしか使っていなかったけれど、ムーアの法則が働き、半導体は進歩しラジオからオーディオそしてテレビへと、家の中の電機製品がどんどん変わっていきました。僕が入社したとき80億円規模だったソニーは8兆円の企業になった。1,000倍になったわけです。

それから、もうひとつ。日本の企業がAIの分野で出遅れたのは、あらゆるものにおいて単一の商品を売ることでしか利益と考えなかったからではないでしょうか。そういう会社はまだ多いです。今は、ハードだけでなくて、データを集めて活用することにもビジネスの価値がある時代、企業の価値もだいぶ変わってきてはいます。

榮藤 いまの世界は「非IT産業をいかに効率化や自動化するか」ということを重視しています。日本の産業が構造的に弱いのは、ユーザー企業にITエンジニアがいないことです。自らの手で効率化、自動化していく視点がまったくない、できないのです。「いくらかかるのか」は言えても「いくら儲かるか」が言えない。AI時代のエンジニアはITの軸とビジネスの軸を表裏一体で動かせる人材がほしいです。

出井 バランスシートにおいても、データをどう価値化するかということが、いまの経営システムではまったく考えられていないですね。

榮藤 データの意味を分からない人が経営していて、データを扱える人はビジネスが分からない、という。

「産学連携」の矛盾と、オタクな東大生がAIで優位な理由

――企業もしくは大学がどういう役割を持って人材を育成するか、というテーマを深掘りしたいと思います。どのようにしてデータの取り扱いを企業価値と結びつけていけばよいでしょうか。

松尾 データをキャッシュに変えるやり方もありますが、データを取ることで次の手につなげられることが大きい気がしています。Amazonのやり方がお手本ですが、eコマースからスタートして次はクラウドに展開して、詰将棋のように事業を展開しました。データがどのように役立ち、ビジネスの勝ちになるか分かっている企業は強いですね。その強みが財務諸表に現れてこないところが問題かな、と。

出井 90年代の終わりに米国に行った時に、Amazonがまだ本を販売する事業しかしていなかった頃のジェフ・ベゾス氏に会った。すると彼は、米国にあるソニーのいくつかの事業所の社員がどこでどんな本を読んでいるかというチャートを見せてくれました。ものすごいショックを受けましたね。つまり、ネットでの販売を通して膨大なデータを蓄積していたのです。

松尾 数字になったデータを読むことで、価値観が分かりますね。

出井 ロサンゼルスの映画のクリエイターと、N.Y.のハードウェアのエンジニアでは読んでいる本がまったく違う。データを見ると個人の価値観がよく分かる。しかし、ハードウェア製品を量販店で売っている企業は、製品を売る時だけしか顧客との接触はなくデータは手に入らない。製品が故障した時にやっと少しのデータが手に入るのです。

松尾 ソニー製品を誰が買っているのかを分析すると、いろいろ分かるかもしれません。

出井 要するに「お客さまは誰で、ニーズは一体何なのか」を知ることが必要です。あらゆるデータを収集し分析すれば見えてきます。データをどのように集めてどう扱えるかどうかで、今後の明暗のが分かれるのです。

―Amazonでは普通の企業では持てないデータを持っていて、「ソニー製品を購入しているひとはポルシェを持っている」「赤い服が好きな人はソニーファン」というような異なるデータを分析しようとしています。大学ではどういう学生に、どういう指導をすれば、人材不足を解消できる優秀な学生を確保できるのでしょう。

榮藤 そのことなのですが、実はいま愕然としています。首都圏の大学がまぶしくみえるわけですよ。いろいろな世界を知っているので、どうすれば社会貢献できるのかなど分かっている学生が多い。大阪に関していえばインとアウトでいえばインです。デザイン、ビジネス、体系的な知識のうち、体系的な知識は教えられます。けれども、アウトにあるデザインやビジネスの知識をどうやって教えていくか考えないとまずいかな、と感じています。ドイツはある程度、改革に成功していますけれども、日本はまだまだです。

どうしたらいいですかね、松尾先生。

(会場笑)

松尾 おっしゃる通りです。私は工学部にいるのですが、そもそも工学部は産業のための学問を学ぶ学部です。工学部には産業界の知識を体系化し、教え、産業界に返すというミッションがあるはずです。だから「産学連携が大事だよね」という言葉に矛盾を感じます。学問のための学問になってしまっている。

出井さんの話から「本当の顧客は誰か?」という教育をすべきですが、現在の大企業にもよくないことあり、新しい産業を生み出せない大企業がたくさんあります。そうすると、ベンチャー企業を設立したほうがいいのではないか。インパクトのある学生を育成したいと思っています。

―これから大企業になる代表として、石井さんはどう思われますか?

石井 まだ大企業には相当遠いのですが(笑)、モビルスを創立して分かったことは数十人の会社でも大企業に勝てるということです。総合力ではぜったいに負けます。しかし、ある1点に人材を集中させるという意味では機動力があります。それから、スタートアップには失うものがありません。それこそ人材がすべて。私が理想としている人材像は、大企業に入社して一度辞めて、スタートアップに転職して燃えつきなかった人ですね。

(会場笑)

かつてはスタートアップといえば慶應義塾大学の学生が強かったのですが、最近はAIというとなぜか東大生が強いようですが。

松尾 それはとてもいいことを訊いていただきました。「Web系」スタートアップと「AI系」のディープラーニングのスタートアップは、必要な素養がちょっと違っています。Web系の場合、プログラミング技術はもちろん一般の人の気持が分かるセンスのよさが必要で、若干遊び人が強いんですね。

(会場笑)

一方、東大生はオタクなので、普通の人の気持ちがまったく分からないんです。ところがAI系はB to Bが中心になるので、他人の気持ちが分からなくても構いません。その代わりに数学が必要です。東大生は、数学が得意で他人の気持ちを分からないオタクが多い(笑)それでAIの分野では、東大生が頭角を表しているのだと思います。

2030年のAIのために準備しておくこと

――最後に、いま何が必要か、そして2030年のために準備しておくことを伺いたいと思います。

石井 2030年になると、自然に人間とAIが対話している時代になっているのではないかと予測しています。いま実は出井ボットというものを作っています(笑)チャットで問いかけると、出井さんのように答えてくれるボットです。そんなボットができるようになれば、自分の父親が亡くなったとしても、いつでも相談ができるようになります。

榮藤 人間と機械のインターフェースは、Windows95、iPhone、最近の音声対話インターフェースのように10年ごとに大きく変わりました。いままでは機械に何ができるかを分かった上でコマンドを入力していましたが、2~3年語には機械と人間が話し合って折り合いをつけ、障がい者にも優しいインターフェースが登場することに期待しています。そうした時代を考えて「コトバデザイン」という会社を起ち上げたのですが、OSSやクラウドなど道具はすべて揃っています。

みんながいろんな対話型インターフェースを作っていくべきだと考えています。単なるエンジン自慢ではなく、みんなが対話型インターフェースを作ってみることが大切です。

松尾 「現在のディープラーニングは20年前のインターネットと同じ」ということをよく言っていて、1998年のインターネットと同じ状況に現在のディープラーニングはあると考えています。技術的には根幹はでき、いろんなアプリケーションの芽も出始めました。ただ、ビジネスモデルと結びついて、巨大な企業は登場していません。しかし2020~2030年代にかけて、AIを活用した企業が次々に生まれるだろうと予測しています。その意味で、技術と産業と結びつく前夜であり、ビジネスチャンスにあふれた時代です。

―AIにおける意味理解、翻訳、データ、企業の在り方などさまざまな領域に話が拡がりました。みなさんもAIを考える機会になればと考えています。本日はありがとうございました。