企業がSNSアカウントを持ち、プレスリリースはネット上で即時発表することが当たり前になった現代。チャンスが広がり便利になった一方で、発信する情報の内容はもちろん、言葉の“正確性”も一層求められるようになった。表現を一歩間違えればたちまち拡散され、“炎上”してしまうリスクとも隣り合わせだ。
芸能や政治のスクープから教育や文化についてのコラムなど、幅広いジャンルの記事を配信している「文春オンライン」の池澤龍太編集長も、日夜頭を悩ませているという。
「文春オンラインでは立ち上げ当初から、すべての記事にプロの校閲のチェックを入れています。ただ、現在ではひと月に500本から600本の記事を配信していて、編集部の少ない人数でこの本数を捌くためには、いかに“省エネ化”するかが大きな課題です。特に事件記事やスクープにはスピード感が求められます。文章の正確性とのバランスの取り方は悩ましいところです」
Web記事はミスがあればすぐに修正できる利点もあるが、SNSなどでミスを“拡散”されてしまうスピードも速い。ちょっとした誤字・脱字や表記の間違いが、記事全体の信頼性を損ねてしまうこともあるため、シビアな問題を扱った記事ほどケアレスミスはご法度なのだ。
「核心に迫るスクープの部分の信頼性まで下がってしまうということは絶対に避けたいです。他のスクープではないコラム等についても、細部まで正確な記事を出すことが長い目で見たブランドイメージやメディアとしての信頼度につながっていくと思うので、気は抜けないですね」(同上)
膨大な校正履歴を学習した“AI校正”ツールの実力
そんな池澤編集長のもとに、ある日、ひとつの依頼が舞い込んだ。朝日新聞社が開発した“校正ツール”、その名も「Typoless(タイポレス)」を試してほしい、というのだ。なんでも、同社の過去40年分の記事データと校正履歴を学習させた、独自の“AI”を使用したサービスなのだという。
1879年創刊の老舗新聞社が開発したAI校正ツールとは一体……? さっそく2月某日、朝日新聞社ビジネスソリューション部次長の福原裕人さんのレクチャーのもと、その実力を体感してみることに。
まずはWebブラウザでTypolessを開いてスタート。画面は大きく左右に分かれており、左側のスペースにテキストを入力して「校正」ボタンを押すと、5秒ほどで右側に校正結果が表示される。基本の動作はたったこれだけだ。
「赤く表示されているのが、AI校正の結果です。今回のデモ用の文面の場合、『本イベントにおては』を『本イベントにおいては』に、『今年の中ば』を『今年の半ば』に変更するなどの指摘がついています」(福原さん)
Typolessに使用されているAIは、朝日新聞社がこれまでに蓄積してきた校正履歴を学習している。日々の校閲でどの言葉がどの言葉に置き換えられてきたか、というデータを厳選してAIに学習させることで、精度の高い校正を実現しているのだという。校正精度は積極的から消極的の3段階で選択でき、消極的に近づけるほど、AIがより確信を持っている指摘だけを表示させられる。
AIと人の目で“いいとこ取り”の校正を
そして、Typolessのもうひとつの柱となっているのが『ルール辞書』機能だ。収録されている朝日新聞独自の“ルール”は約10万個。デモの文章では、重複表現となる「過半数を超える」や、ジェンダー平等に配慮すべき「女性ならでは」といった表記に青い指摘がついている。
また、AI校正とルール辞書のハイブリッドに加え、ユーザー自身がルールを登録できる「カスタム辞書」機能も完備。3つの辞書にそれぞれ1000語まで登録し、使い分けることができるほか、インポート・エクスポートも可能なので、編集部内や社内での表記ゆれを統一するのにもってこいの機能だ。「これは文春オンラインでも活躍しそうですね」と池澤編集長は言う。
「文春オンラインの場合、記号や英数字を半角で書くというルールがあるんですが、たくさん出てきた場合に全てチェックしきれているかというとやや微妙なところはあります。より多くの記事を出すために、そういったチェックにかけている時間をなるべく減らしたいとは常々思っているので、校正ツールが一括で見てくれると安心です」
一度に校正可能な文字数は、なんと2万字。ルール辞書やカスタム辞書を使用するかどうかの選択や、校正結果をAI校正・ルール辞書・カスタム辞書で分けて表示するといった操作も、ワンクリックで直感的に行える。すべての指摘は“無視”も選ぶことができ、ひとつずつの結果に対して反映する・しないを選択していくと、自然と文章が完成する仕組みだ。
「2万字もあれば、Web記事も含め、企業がネット上で発信する文章の多くをカバーできそうです。すべてをAIに任せきりにするのはなんとなく不安が残りますが、人の目では見落としがちなところをAIにサポートしてもらいつつ、最終的には人の目でチェックして取捨選択することで、“いいとこ取り”の校正ができるというわけですね」(同上)
炎上リスク対策に最適な“究極の外の視点”
さらに、Typolessには現代社会に嬉しい機能も備わっている。本文のテキストを選択すると現れる「炎上リスクチェック」ボタンを押すと、リスクのある言葉や表現が含まれていないかをチェックできるのだ。これには、普段“炎上リスク”を間近で感じている池澤編集長も興味津々といった様子に。
「気をつけてチェックしていたとしても、どうしても意識からすり抜けてしまう部分はあります。インターネット上の事例を見ていても、そういうすり抜けてしまう部分こそが一番炎上につながるんですよね。社内の人間で何重にチェックしても、業界の常識と世間の常識がズレていることもありますし、同じ表現でも世代や性別によって感じ方が変わります。“究極の外の視点”という意味では、AIは最適なツールかもしれないですね」
多様な機能を持つTypolessだが、「一番の強みはやはり、AI校正の“エラーの発見率”です」と福原さんは言う。実際に、他の文書作成ソフトの校正では指摘が入らなかった文章をTypolessに入力してみると、多くの間違いが指摘された。それもそのはず。誤りが含まれた100個の文章を入力したときにいくつ誤りを見つけられるかというテストでは、Typolessは他の追随を許さない高スコアを叩き出している。
世の中の校正ツールの多くは、定められたルールに対して、入力された文章が合っているか・合っていないかで正誤の判断をしている。しかし、その方法では助詞の“てにをは”や同音異義語など、文脈から判断する必要がある指摘は困難だ。また、パソコン作業で生まれやすいタイプミスも組み合わせが無限にあるため、これもルールですべてを定義するのは難しいのだという。
その点、TypolessのAIは、入力された文章の一語一語を見て、文章に適しているかどうか、誤っているならどう直せばいいかを判断しているので、助詞の間違いやタイプミスも指摘できる。
「AIなので校正履歴を学習して、どんどん性能自体が良くなっていくのも、従来の校正ツールとは一線を画すポイントです。ちなみに、AIが学習するのは朝日新聞社の校正履歴だけで、入力したテキストは一切サーバーに残らないので、文春さんのような秘密情報が多い企業の方にも安心して使っていただけます(笑)」(福原さん)
今後はより高度なミスへの対応も
昨年10月のリリース以降、出版社やウェブメディアをはじめ、一般企業でも導入事例が増えてきたというTypoless。SNSをはじめ発信する機会が増えたことや、社会全体のミスへの許容度が低くなってきたことで、少しのミスでも会社やブランド全体に大きなダメージを与えるリスクが懸念されているようだ。
「リリース当初は、朝日新聞の自社データが強く反映されるようなモデルにしていました。ただ、導入事例が増えるに従って、新聞ほど固くない、柔らかい文章やカジュアルな表現への対応も求められるようになったため、最近リリースしたモデルは、世の中のいろんな文体にマッチするように進化しています。ユーザーの声を聞きながら、よりたくさんの方が利用しやすくなるようにAIを開発していきたいです」(同上)
今後はWordファイルやPDFファイルでも使用できるようなモデルに加え、一人称の表記ゆれや著名人の名前の誤字といった高度なミスにも対応できるようなモデルの開発も進めていく予定だと聞き、池澤編集長は大きく期待を寄せた。
「特に著名人の名前やグループ名などの固有名詞は、間違えてしまうとファンにとっては大問題ですし、記事全体の信憑性まで揺らいでしまいます。そういう“うっかりミス”が減らせるようになるとありがたいですね」
AIによる校正は、単に校正時間を減らすだけでなく、修正への対応や炎上した際の“お詫び”など、ミスによって生まれてしまう余分な時間の削減にもつながる。企業の情報発信において、AI校正が“必須ツール”となる日も近いかもしれない。
提供/朝日新聞社