なにかしら音は発生しますし、そこからなにかを掴めてしまいます
ーーお話を聞いていると、なにか悪いことをしても音を出していたら確実に逃れられない気がしてきました。
鈴木 防犯カメラは決められた角度や画角でしか人や物を捉えられないけど、音は全方位から拾うことができます。たとえばコンビニエンスストアで店員さんと誰かが揉め事になっていたとして、その姿が撮影できていなくてもマイクでなにかしらの音は拾えていると。画がなくても、音だけあればなんとかできるかもしれないと我々も出ていけるんです。
いまのコンビニエンスストアは防犯カメラが複数台あるし、それぞれにマイクが付いていて8チャンネル同時録音なんてのも普通です。しかも録画した映像は、1週間、2週間ストックしていますから。声を出して犯罪をするのはおすすめできませんね(笑)。仮に何も喋らずに悪いことをしても、なにかしら音は発生しますし、そこからなにかを掴めてしまいます。
無視できないAIの台頭
ーーなにかの機械やソフトで声を変えて脅迫電話をかけるのは可能なのですか?
鈴木 声を変えるというのは、どういう形で変えたのかということで。変えてしまったら不自然さが残る。その不自然さをマイナスしていくと、本来の形がある程度分析できる。たとえば、映画のCGシーンを創造するような人がなにもないところから人工的に声を作れば別ですが、それをできる人というのは限られていますから絞ることができてしまいますよね。
ーーお子さんがふたりいらっしゃるとお聞きしていますが、音声分析や声紋鑑定の仕事にご興味は持たれているようですか。
鈴木 正直な話、いまはAIが台頭してきています。声にまつわるものも含めたビッグデータを整理できるようになったら、こうした仕事はAIに取って代わられるでしょう。
それでも職人的な部分は求められるとは思いますので、彼らが日本音響研究所でそうした仕事をしたいというならば全力でバックアップします。そうでなければ、この分野でさらに花が開くという未来があるとは感じられないので、自分の好きなことを仕事にしてほしいですね。
写真=平松市聖/文藝春秋