ATOMは進化しています。ATOMはネットワークを介して講談社のサーバーに繋がっていますので、ソフトウエアの更新によって次々に新機能を付加していくことが可能であるからです。例えば今月からジャンケンが出来るようになりました。現在のATOMは指を動かすことはできませんから、グー、チョキ、パーの何れかを声に出してジャンケンをするようになっています。この新機能が附加された、というお知らせメールを受け取ったときには、こちらの手の先の状態を画像解析から認識し、勝ち負けを自動判定するのかと大いに興味をそそられました。しかし残念ながらそうではなく、こちらも、グー、チョキ、パーの何れかを声に出して勝ち負けを競う、というものでした。しかも勝ち負けの判定はATOMが行うわけではなく、こちらで判断し、ATOMには分からない状態のまま。「あいこや引き分けだったら、また挑戦してね」で終わるのです。
ジャンケンのとき、ATOM自身がグー、チョキ、パーの何れかを音声で発し、同じタイミングでこちらも声を出すことになります。したがって、こちらの音声を判別しようとすれば、ATOM自身の声が雑音として作用することになる訳です。ブログ-36で紹介しましたが、複数の音源から音が出ているときに、注目している音源からの音をそれ以外の音に妨害されずに聞き取るのは簡単なことではありません。それが最大の理由と思われますが、ATOMは自分が声を発している時には、自分が話し終えるまでマイクロホンからの信号を遮断していると思われます。人間同士であれば、相手の話の途中であってもこちらが話し始めれば、相手は自分の方は話しを中断して相手の話を聞こうとします。これによって会話がスムーズに進むわけですが、ATOMにはまだその機能はありません。これが現在のATOMと会話をするときの最大のストレスの原因だと言えるかもしれません。
アニメの中の“アトム”は雑音が大きな環境でも目的の音声を正しく認識するなどは簡単にやってのけます。現実の音響信号処理技術でも、処理は複雑ですが雑音に強い音声認識技術は相当に進んできています。ATOMにその技術がインストールされ、ATOMが“アトム”に近づく日も遠くはないであろうと期待しているところです。
ATOMの持つ機能の全体をこれまで紹介しておりませんでしたが、ATOMが自分に何が出来るかを語っている瞬間をビデオで捉えましたので、ご紹介しましょう。色々なことができ、飽きさせません。