データを扱うために必要な3つのキー
「ただ、データサイエンスは簡単ではないんです。もちろん私も最初はなんの知識もありませんでしたから、イチから勉強しました。そうするとデータサイエンスには3つの要件が大事だということがわかってきたんです。
ひとつは、大量のデータを扱える環境。いわゆるビッグデータをオフィスのパソコンで扱えるわけがないですから、大量のデータを蓄積できるクラウドサービスを利用することにしました。
次はデータそのもの。ICOCAのようなICカードによるお客さまの動向から車両などのデータが当社には既にあったので、それを活用できるようにまとめていくようにしました。
そして最後が実際にAIモデルを開発するデータサイエンティスト。こればかりは社内ではどうにもならない。外注しようにもどの会社さんが優れているのか評価できない。そこでコンペを実施しようということになったんです」(宮崎さん)
そのコンペが、件の新幹線の着雪問題。そして驚くべきことに、コンペの入賞者の中にJR西日本の社員が含まれていたのだとか。それも社業としての応募ではなく、完全に趣味としての応募。思いがけず優秀なデータサイエンティストの発掘にもつながり、今では宮崎さんの部下として活躍中だとか。
「この自動改札機は90%壊れる」
こうしてはじまったJR西日本のデータサイエンスの活用。まだ端緒についたばかりではあるが、着雪問題で結果を出したことで信頼を獲得。少しずつ実用化されているものも増えている。
「たとえば自動改札機の故障予防。簡単にいえば来月故障するかどうかを予測するんです。自動改札は機械的にログをずっととっているので、そのデータをもとに計算すると来月に90%壊れる、30%壊れる、とわかるんですね。どの部品が原因で故障するかどうかもほぼほぼわかる。そうなれば、6割以上壊れると予測されているものだけを開けて点検すればいいので効率的ですよね」(宮崎さん)
さらに、山陽新幹線の線路側に集音マイクを設置して通過音を録音、その周波数のデータから故障につながるような異音を察知するシステムも導入されている。山陽新幹線では2017年に異音を確認しながらもそのまま博多から新大阪まで走行し、のちに台車に亀裂がはいっていたことが判明するというインシデントがあった。そうした事態を防ぐためのひとつのアイデア、というわけだ。