「読んde!!ココVer.11」活用のススメ〜データ再利用にはPDFテキスト化がベスト〜(1/3 ページ)

» 2005年06月07日 00時00分 公開
[小川夏樹,ITmedia]

突然ファイルが消失。それを救ってくれたのがOCRソフト

 私事で恐縮だが、筆者は「OCRソフトはPCソフトの中で“必須ツール”である」と固く信じている。これは、筆者がOCRソフトに危機的状況を何度か救われたことがあるためだ。

 筆者はPC系雑誌の編集を経て現在著述業を生業としているが、編集者時代にOCRソフトによって救われた経験がある。また、OCRソフトによって救われた編集者を何度も見てきている。そういった経験から、OCRソフトはPCを利用して文書ファイルを扱う仕事に携わる人間にとって必須ツールであると思うのだ。

 話は10年ほど前のWindows 95の時代に遡る。ITmediaの読者なら覚えている方も少なくないと思うが、Windows 95が登場したことで世間はお祭り騒ぎとなった。

 「PCを買わないとまずいんじゃない?」「なんだか分からないが、今度のWindowsってすごいらしい」などと、お祭り騒ぎに煽られてPCの購入に走る消費者も多かったのだ。PCは売れに売れ、「オタクのための機械」から一家に1台の道具へと一気に昇格したのである。このため、PC初心者が大量に発生。各出版社からPC入門から活用まで、新雑誌の創刊が相次ぐこととなった。

 一方、創刊ラッシュによって新雑誌が続々と生まれたため、出版者側は慢性的な人手不足に陥ってしまった。専門誌であるPC雑誌の編集には、編集スキルに加えて、PCの知識が必須条件だ。当時、そういったスキルのある人間はまだ少なく、仕方なく少ない部員数で雑誌を作らなければならないという事態になった。

 しかし、登場したばかりのWin9xカーネルは、MS-DOSに皮をかぶせただけのWindows 3.1より使い勝手はマシだったものの、すぐにブルースクリーンが表示され、アプリケーションを抱えた状態で落ちてしまう代物だった。現在のWindows XP(NTカーネル)のように、長期間の連続稼働に耐えるようなものではなかったのだ。そんなOSと格闘しながら、PC雑誌の編集者たちは連日徹夜を繰り返し、原稿整理していたのである。

 不安定なOSを使っているのだから、当然事故は起きる。必死で編集した原稿が突然のブルースクリーンで水泡に帰すなどということは、日常茶飯事であった。例えば、6時間かけて編集した原稿が編集前の生原稿の状態まで戻ってしまったり、ヘタをすると原稿自体がどこかに消えてしまうという不運な事故が、各編集部で毎回のように発生していたのである。

いざというときのための必須レスキューツール

 ある日のこと、筆者が徹夜で編集した原稿(A4用紙で12ページ分)を印刷し、それをホッチキスで止めて自分の机の上に置き、そのまま眠りに落ちた。数時間後に目を覚ますと、PCの画面はブルースクリーンが表示されて停止していた。

 こんなことは当たり前だったので、迷わずリセットボタンを押してPCを再起動。印刷した原稿を読みながら、PCに保存しておいた原稿を修正しようとした。しかし、HDDのどこを探しても、徹夜で編集した原稿が見つからないのである。単にテキストに名前を付けて保存していなかったのか、それともブルースクリーンによってファイルが消失してしまったのか、今となっては分からないが、締め切りは数時間後に迫っている。12ページ分の原稿を初めから編集し直す余裕などない。

 筆者が取った行動は、印刷した原稿をスキャナに読み取らせ、それをOCRソフトでテキスト化することであった。もちろん当時のOCRソフトは、現在のものと比較にならないほど認識率が低い。しかし、最初から入力し直す手間に比べると、OCRソフトで読み取らせたテキストを修正する方が効率的だったのである。

 このおかげでなんとか締め切りに間に合わせることができた。筆者は、この事故以降、いざというときのためにOCRソフトを用意しておくのは、テキストを扱うユーザーには必須ではないかと思うようになったわけだ。印刷されたテキストデータが残っていれば、たとえHDDが飛んでデータが失われてしまっても、OCRソフトを利用して被害を最小限に抑えることができるかもしれないからである。

OCRソフトとの連携で、さらなる有効活用を実現

 話を一般的なケースに戻そう。

 小型両面カラードキュメントスキャナのScanSnap「fi-5110EOX3」は、筆者にとっても非常に魅力的な製品であるが、添付されている日本語OCRソフト「読んde!!ココVer.11」(以下、読んde!!ココ)は、製品版ではなく体験版である。利用できる機能が制限されていたり、利用できる期間がインストールから15日間に限られている。そこで、ここでは読んde!!ココの製品版を用意し、ScanSnapとの強力な連携機能について見ていくことにしたい。

 なお、注意点としては、読んde!!ココからScanSnapを呼び出して利用することができない。これはScanSnapの仕様によるもので、ScanSnapの利用時に読んde!!ココを起動するように設定しておく必要がある。

「ScanSnap Manager」で読んde!!ココを使用するアプリケーションに設定しておくことで、ScanSnapと読んde!!ココとの連携が可能になる
ScanSnapで読み取ったデータは読んde!!ココに送られてOCR処理が実行され、認識結果が表示される
       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

最新トピックスPR

過去記事カレンダー