文春オンライン
〈約153万点がオンラインで閲覧可能に!〉話題の「国立国会図書館デジタルコレクション」は何が読める?

〈約153万点がオンラインで閲覧可能に!〉話題の「国立国会図書館デジタルコレクション」は何が読める?

2022/05/27
note

まもなく高速・テキスト検索が可能なシステムに入れ替わる?

 ところでこうした資料のデジタル化は、どのように行われているのでしょうか。実は今回公開されている資料の中に、それらを詳しく紹介した冊子があります。「国立国会図書館月報」の733(2022年5月)号がそれです(PDFがこちら)。

 これらの中には、国立国会図書館での資料のデジタル化事業について、スキャンを行っている作業場の写真とともに、資料の選定から外注先への輸送、撮影、目次データの作成といったプロセスが紹介されています。折込ページなど特殊な製本の資料をスキャンするための工夫など、興味深い情報も掲載されています。

 そしてこの特集では、テキスト化によって全文検索や読み上げに対応した「次世代デジタルライブラリー」についても触れられています。

ADVERTISEMENT

 現行の「国立国会図書館デジタルコレクション」は、検索精度は決して高くなく、また速度もお世辞にも速いとはいえません。またそこで見られる資料も、作業効率優先のために目次データのテキスト化が省略されているケースがあるとされています。

 これに対して「次世代デジタルライブラリー」では、過去にデジタル化した資料に遡ってテキスト化の処理を実施しており、高精度の検索が可能なほか、検索ワードにはページ内で目印がつけられるため分かりやすく、さらに動作も高速とあって、期待が高まります。

 すでに実験ページで利用可能なこのシステム、2022年12月には「国立国会図書館デジタルコレクション」に反映される予定とあって、こちらも期待したいところです。

〈約153万点がオンラインで閲覧可能に!〉話題の「国立国会図書館デジタルコレクション」は何が読める?

X(旧Twitter)をフォローして最新記事をいち早く読もう

文春オンラインをフォロー