機械との対話に求める「人間性」
黒川:1991年4月1日に稼働した私の女性司書AIに、7月にあるクレームがついたんですよ。「はい」の回答が三つ以上続くと、冷たい印象があるということで。
福田:それは、どういうことですか。
黒川:たとえば「こういうデータありますか」「はい」。「それには図面は付いていますか」「はい」。「FAXで送れますか」「はい」とか。そうすると「はい」が3つ画面に並ぶんですね。当時、「35歳の美人女性司書の会話にしてほしい」という発注仕様だったので、たおやかなプロの女性を感じさせる言葉使いなんです。プロの女性なので、イエスのときは全部「はい」なんですけども、3回続くとなんだかつらいと。
福田:邪険にされた感じがするんでしょうね。
黒川:「はいはい」ってね。妻が、「はい」を三つ言うときは大抵、邪険にされてますから(笑) それで私も興味が湧いて、じゃあ、普通の生身の人間だったら、「はい」「ええ」「そう」とバリエーションがあるから、その三つを使ってみようと。だけど当時は、「はい」「ええ」「そう」は全部、うなずきの肯定語なので、それ以上分類できるようにデータベースは作られてないわけですよ。それでどうしようかなと思って、ランダム関数を使いました。つまり「はい」「ええ」「そう」がランダムに挿入されるんですけど、そうするとみんなが違和感を感じるところが一緒なんです。「ここは、はいじゃないと安心できない」とか、「ここは、ええじゃないときつ過ぎる」。
福田:すごいですね、その語感が持つ共通の印象といいますか。
黒川:すごいんです。今のように音声や画像はないので、言葉一つ一つに人間性を感じていたというか、逆にみんなが研ぎ澄まされていたんですよ。「はい」は、確実な感じがするけどきつい。「ええ」は優しいけど、すぐに答えが返ってこないような気がする。「そう」は、なだめられているような感じ。この三つに対しての感性の違いを数値化しないと、人工知能に認知させられないわけですよね。人間なら、2、3の例を言って、ここは「ええ」だよ、とか、ここは「そう」だよ、で分かる。でも人工知能は分からないから、これを数値化しないといけない。
そこで語感の数値化の研究を始めたんですけど、そのとき初めて、「伊保子」と弟の名前の「ケンゴ」の語感の違いを、ずっと自分が謎に思ってきたことを、今ここで解明するんだなとハッとしました。語感というのは発音体感であって、息が抜けていく速度とか、舌が上あごに張り付く面積とかで感じる、脳に浮かぶイメージが語感なんだっていうことに気が付いたんです。
福田:黒川さんの中では、すべてつながっていますね。面白いです。