【今回レビューする製品】2024-2025年 日本語対応OCRソフトの認識精度と選び方:読取革命17ほか製品版・無料版・バンドル版対応:変換精度の違いやおすすめランキング やOCRフリーソフトとの違いについて:読取革命17と読取革命16の違い:資料・名刺・縦書き文書認識、英語日本語混在文書の精度など
【比較するソフト一覧】ソースネクスト 読取革命 Ver.17 Ver.16 Panasonic 読取革命 Ver.15 e.Typist v.15.0 Adobe Acrobat pro Acrobat Standard ソースネクスト本格読取 5 DocuWorks 9.1 やさしく名刺ファイリング PRO v.15.0 コリャ英和 一発翻訳 2025 for win LogoVista PRO 2025 ほか
今回のお題
変換精度が信頼できる日本語OCRソフトのおすすめはどれ?
ども、Atlasです。
今日は、2024年12月現在、最新の日本語OCRソフトを比較します。
ソースネクストの読取革命17ほか、メディアドライブのe.Typist v.15.0、実はOCR性能が高いAdobe Acrobatなど、各社のOCRソフトの使い勝手や認識精度を比べていきます。
記事は各ソフトの基本機能の紹介をしたあと、Atlasによる認識精度の検証実験の結果を画像を交えて紹介していきます。
なお、Atlasは、(おおよそ)20年程前の大学院生時代にOCRを利用しはじめました。
そして、ここまで試したソフトは、(バージョンの違いを合わせると)25本を超えます。
なお、今回の記事は、学生や研究者などが、論文・資料を「検索可能な透明PDF」にする目的のほか、会社員の方が、会議資料や名刺のスキャニングする場合についても、対応できるようにしました。
ーー
認識精度(日本語)★★★★★
認識精度(英語) ★★★★★
レイアウト認識力 ★★★★★
縦書きの認識力 ★★★★★
文字の見やすさ ★★★★★
総合評価 ★★★★★
記事の最後の「結論」では、上表のようなポイントから、予算別・目的別に、Atlasのおすすめ機種を提案していきます。
ーーー
1・日本語OCRソフトの比較
2・英語OCRソフトの比較
3・PDF作成ソフトの比較
なお、今回の記事は、このブログのOCRソフトの比較シリーズの「1回目記事」として書きました。
1・本格的なOCRソフトの比較
というわけで、本編です。
ここからは、読取革命ほか、各社の日本誤対応のOCRソフトの機能性について各機を順番にみていきます。
---
なお、以下では、Atlasのおすすめポイントは赤字系の文字色で、イマイチとおもう部分は青字で記していきます。
【2024年発売】
(ダウンロード版)
1・ソースネクスト 読取革命 Ver.17
¥8,980 ソースネクスト直販 (12/14執筆時)
(パッケージ版)
1・ソースネクスト 読取革命 Ver.17
¥9,700 Amazon.co.jp (12/14執筆時)
(ダウンロード版)
1・ソースネクスト 読取革命 Ver.17
¥12,980 Amazon.co.jp (12/14執筆時)
【2020年発売】
2・ソースネクスト 読取革命 Ver.16
¥9,700 Amazon.co.jp (12/14執筆時)
【2012年発売】
3・Panasonic 読取革命 Ver.15
¥10,380 Amazon.co.jp (12/14執筆時)
言語:日本語・英語
対象書体:5種類以上
対象文字種:JIS第2水準(6800文字)
単語辞書:18万語
専門辞書:61万語
文章校正:AIトータルアシスト
読取革命 17は、ソースネクストが発売するOCRソフトです。
もともとは、パナソニックの人気のOCRソフトでした。
しかし、2020年10月に開発元がソースネクストに変更になりました。その後、2024年8月に、ソースネクストによる更新があり、現在は読取革命 Ver.17が最新です。
OCRソフトは、各社とも(ほぼ)機能更新がないなか、この企業のみ「気を吐いて」います。
価格は、時期により、どの購入形態が安いかは都度変わります。とくに、直販だと安い時期があります。
買われる場合、セール期間は、一応チェックしてみてください。
以下では、はじめに、旧バージョンと新バージョンとの違いを、はじめに確認しておきます。
1・英語OCRの精度の改善
2・インターフェースの改良
3・起動時のパスワード設定
4・クラウド保存対応
5・Google翻訳対応
6・認識結果表示フォントの追加
第1に、読取革命16(2020年発売)時の改良です。
ソースネクストらしく、UIなどの使い勝手の部分の改良でした。
一方、本質的な機能性では、英語OCRエンジンの更新、表示フォントの改良に止まったので、日本語の認識精度の向上に関わる部分は、加算も減算もなく「ノータッチ」でした。
1・AIトータルアシスト機能
2・QRコードによる画像送信
第2に、読取革命17(2024年発売)時の改良です。
今回は、AIトータルアシストが目玉です。
AI(ChatGPT)による文章認識・理解機能を利用して「自然な文章に」修正するというものです。
詳しい詳細は後ほど書きます。しかし、軽度な修正に止まりそうな状態のよい横書きのビジネス文書の場合、作業効率の向上が見込めます。
---
結論的にいえば、Windows11への対応状況を含めて、特にパナソニック時代のものからは、更新する甲斐が多い製品と言えそうです。
日本語認識は、パナソニック時代のエンジンをそのまま使います。
文字を映像から「文字起こしする」解析技術は、業務用を含めて、各社ともここ10年以上進化が止まっています。
紙の文書のDX(=デジタル化)は、2010年代までで道筋が付いたこともあり、市場のニーズを考えても「このまま」かなと思います。
しかし、すでに(仕事用としては)10年前には「実用レベル」だといえばそうです。
ゴシック体・明朝体・教科書体・ワープロ体は、MS系・ヒラギノ系などをふくめてほぼ完全に認識します。
メイリオや、各社の新聞フォントなど、あまり凝っていないフォントの認識も精度高くできます。
しかし、(英語に比べて文字数が多い関係で)金属活字時代の昔のフォントや、文庫本などのルビ(ふりがな)付きの文書などの認識精度の向上は、多くの場合、課題です。
このあたりが、研究者や図書館関係者には辛い部分でしょう。
認識できる文字数は、JIS第2水準の文字を含みます(6800字)。
ライバルのe-typistと同じですが、難しい名字なども精度高く認識します。
昔あったスキャナなどのバンドル版(ライト版)の無料OCRソフトとの大きな違いで、専門ソフトをかう魅力は、この部分にあります。
名詞を含めて、姓名などの旧字体のデータを取り込もうと考えている場合、かなりの効果があると言えます。
用語辞書は、18万ワードです。
OCRエンジンは、画像から認識した文章(文字)が、国語辞典類などに載るような「用例」として存在するか参照しながら、精度の高い変換をする仕組みだからです。
本機の場合、単語辞書(文字パターン辞書)は18万ワードです。
市販ソフトで公開されているものの中では最も多いです。
専門用語辞書は、61万ワードです。
単語辞書を補助するためのもので、専門分野の認識精度をあげるためのものです。
ここもかなり強いですが、(『現代用語の基礎知識』のように)実際的にデータの入替がないので、新しい用語にはほぼ無力です。
ここは、改善の余地が大きいと言えます。
対応する言語は、日本語ほか、英語、一部のギリシャ文字です。
英語は、認識エンジンを米国で、FineReaderという米国ではトップシェアの変換エンジンを利用します(2020年更新版)。
ただし、製品版のFineReaderと比べると収録する「専門辞書」が未搭載で、(無数にある)英語フォントの再現性もないです。
結論的にいえば、この部分の精度を期待する場合、日本語と英語は「別」と考えて、それぞれ専用ソフトを揃えることをおすすめします。
4・ABBYY Fine Reader Standard
¥13,530 Abbyy直販 (12/14執筆時)
5・Omnipage Standard 18.0
¥17,099 Kofax直販 (12/14執筆時)
6・Readiris PDF 365
$ 129 irislink.com (12/14執筆時)
なお、英語専用OCRの精度は、別に【おすすめ英語OCRソフトの比較記事】があります。翻訳用として考えている方は、そちらをご覧ください。
画像解析は、一定の機能性があります。
例えば、取り消し線付きの文字の認識や、小さい文字(6pt)の認識、縦書き横書きの判定、文字と画像・図表(98×98)を把握してのOCR処理、QRコードの認識などです。
この部分にかんする実験は、記事の後半で書きますが、パナソニック時代から引き続き、段組文章の把握や、印刷状態の悪い文字の認識は、強力と言えます。
編集機能は、充実します。
後述する、Acrobatは、透明PDF(=画像としてもともとの画像をPDFで表示しつつ、テキストを画像の下に埋め込んで、検索できるようにしたPDF)を含めて、OCR化したテキスト自体の編集はできません。
本機は、しかし、埋め込んだテキストを適宜修正した上で、埋め込めるので、この部分の精度が必要な場合、有利です。
補助機能も充実します。
半角・全角の一括変換や、認識結果と元画像を、1行単位で比較できるハイパーチェッカーも便利です。
一方、読取革命17からの新機能として注目されるのは、AIトータルアシスト機能です。
先述のように、AI(ChatGPT)の文章系AIを利用した校正機能です。
OCRエンジンの認識結果を、上記ボタンで、AIに受け渡し、その力で「自然な文章に」修正します。
全文の一括修正ほか、選択した部分の修正も可能です。
日本語だけですが、誤認識や、誤字・脱字を修正して「自然な文章に」してくれます。
注意点はテキストの文脈だけ見て、AIが修正(文章校正)をしている点です。
画像解析ができるAIではないので、元画像をふまえた判断はできません。
前後のテキストの文脈から(国語的な意味で)「自然な文章に」はしてくれます。しかし、数字の間違いは直りませんし、専門用語・特殊用語の変換も苦手と言えます。
小学校で例えるならば、担任の先生が、全校集会で読む読書感想文を、「子供の意図」を理解せずに自宅で「手直し」したようなものです。AIが文章を「推測(想像)」で直してしまう部分があるので、業務で重要な文書に使う場合、誤字脱字が「嘘」に化けていないか、再チェックが必要です。
AIの映像分析がないのは残念です。しかし、ここは大量の画像データを機械学習させる必要があるので、相当大きなプロジェクトが動かないと(日本語では)無理かなと思います。
--
結論的にいえば、多かれ少なかれ「課題」はある新機能です。
しかし、旧機と同じ価格帯での販売ですし、新味がある豪華な付属機能と言えます。
実際、AI(ChatGPT)の文章校正を手軽に試せる機会と言えますし、皆さんの使途によっては有用かもしれません。個人的にも、15年以上(ほぼ)進化しないOCRソフトの新しい可能性を示すものとして、注目しています。
文章の保存は、WordやPDF(透明PDF)を含めて、各形式に対応です。
その上で、クラウド対応(Google Drive, One Drive, Dropbox Google翻訳)となりました。
動作するOSは、Windowsのみです(Win10以上)。
スキャナーから直で取り込む場合は、TWAIN対応です。
--
以上、読取革命 17の紹介でした。
日本語OCRでは唯一更新が続くOCRソフトです。
OCR解析や専門辞書の部分の進化は止まっていますが、使い勝手の部分は、しっかり進化しているので、専用ソフトを考えている場合、第一の選択肢にできます。
割と古い書類、保存状態の悪めの書類でも間違わずに対応してくれる部分を含めて、はじめて買う方にはこちらがおすすめです。
【2013年発売】
【パッケージ版】
7・e.Typist (アジア言語対応)v.15.0
¥14,209 Amazon.co.jp (12/14執筆時)
【ダウンロード版】
8・e.Typist (アジア言語対応)v.15.0
¥13,366 Amazon.co.jp (12/14執筆時)
言語:58言語
対象書体:10種類以上
対象文字種:JIS第2水準(6800文字)
単語辞書:6万語
専門辞書:150万語
文章校正:
e.Typist 15は、メディアドライブが発売するOCRソフトです。
2013年とロングセラーです。
しかし、先述のように、この間、日本語OCRエンジンの更新は、どこも見られないので、陳腐化しているわけではないです。
日本語認識は、本機も、一定の精度があります。
後ほど「実験結果」を見るように、印刷された会議資料のような状態の良い原稿の場合、読取革命と同等か、それ以上の精度を得られる場合もあります。
縦書きも(複雑なレイアウトでないならば)無難にこなしますし、斜体の認識もできます。
フォント認識も、明朝・ゴシック・教科書体ほか、10種です。
一方、保存状態の悪い文章、昔の字体の書類などの認識精度はイマイチです。
とくに、論文などでみかける「縦中横(縦書きの日本語の文章中に横書きの英語文字が混在する文章)」の認識は、同じく対応する読取革命に比べても劣ります。
認識できる文字数は、読取革命と同じでJISの第二水準です(6700字)。
問題ありません。
用語辞書(解析辞書)は、6万語です。
専門用語辞書(認識辞書)は、150万ワードです。
ようするに、用語辞書は、読取革命に及ばず、専門用語辞書は、かなり多めです。
後ほど書く「実験結果」にもこの部分の違いが出ています。
ただ、読取革命と同じで、近年の辞書更新はないので、新語には弱いです。
対応する言語は、本機のポイントです。
欧州系の各言語ほか、アジア言語(韓国語・中国語)なども対応です。
この部分は、読取革命との差で、価格が高い理由でもあります。
ただ、それぞれの言語に、用語・専門辞書はないので、英語を含めて、各国の専用製品とは変わると言えます。
画像解析は、読取革命と甲乙があります。
600dpiの読み取り時に限られますが、5ポイントの極小文字も対応とされる部分はこちらが優れます。
また、画像・写真・表の分離(レイアウト認識)も、横書きについてはこちらがやや良いです。
一方、先ほども少し振れましたが、状態の悪い原稿の認識精度はあまり良くないです。縦書きも、レイアウトが複雑(ルビ・図表など)だと、イマイチです。
編集機能は、充実します。
オーバーレイ機能が注目点です。
読取革命ハイパーチェッカーに相当するものですが、行単位ではなく、編集結果の下にオーバレイ表示されるので、校正に便利です。
一方、 取り消し線の処理を含めて、状態の悪い原稿の処理は全般的に苦手です。
また、AIトータルアシスト機能など、プラスアルファの編集機能は、読取革命ほど充実しません。
文章の保存は、WordやPDF(透明PDF)を含めて、各形式に対応です。
クラウドは、Evernote・SugarSyncには対応です。
動作するOSは、Windowsのみです。
---
以上、メディアドライブのe.Typist 15の紹介でした。
後ほど「実験結果」でも書きますが、専門辞書が充実する部分もあり、状態のよい原稿の場合の認識精度は(AIトータルアシスト機能を使わないこと前提で)割と良いです。
一方、原稿の保存状態にかなり左右される傾向があります。また、縦書き原稿のレイアウト認識(縦中横やルビ)は、イマイチなので、図書館等で(昔)コピーした論文などは、読取革命のが実際良いです。
〈オンラインコード版〉
9・Acrobat pro 12ヶ月版
¥21,312 Amazon.co.jp (12/14執筆時)
10・Acrobat Standard 12ヶ月版
¥16,560 Amazon.co.jp (12/14執筆時)
言語:13言語
対象書体:
対象文字種:
単語辞書:
専門辞書:
文章校正:
Adobe Acrobat は、アドビ社のPDF作成ソフトの製品版です。
特に、Adbobe Acrobatシリーズは、使い方によっては「御三家に匹敵する利便性」を得られるため、注目するべきです。
販売形態は、今は「定額制(サブスク)」だけとなっています。
「永久ライセンス版」が過去にはありましたが、現在は、完全に販売終了となっています。
ライセンス契約の現状は、このブログの別記事となる【Acrobatのライセンスとお得な購入法】で書きましたので、今回は、あくまでOCR機能の説明に集中します。
このソフトの基本用途は「PDF作成」です。
しかし、付属する便利機能の1つとして、OCR機能が付属します。
後ほど実験するように、日本語の縦書きの対応能力などに限界がありますが、PDFファイルのOCR化に使う分にはかなり高性能です。
とくに、「検索できるPDF」を作る場合、【PDF作成ソフトの比較記事】で紹介したように、書類の文字の「画像」を、ベクターデータ化できるため、テキスト検索できるようになるだけでなく、画面での文字の見かけも綺麗にできます。
拡大ズームをかけても「歪まない」よう「疑似的なフォント化する」という意味です。
日本語認識は、むろん、対応です。
エンジン自体は、過去の情報だとEpson(AiSoft)の読んDE!!ココ から提供されたものです。
本家は家庭用が終売なので、今だと「オリジナル」とも言えます。
用語辞書などの情報は、非開示です。
あくまで「おまけ」機能だからでしょう。
精度は、後ほどの「実験」で示します。
対応する言語は、日本語・英語のほか、ヨーロッパ言語・アジア系言語を含む13言語です。
文章の保存は、仕組み上、(透明)PDFのみです。
ただ、その後で、(認識データベースで)Wordなりに変換は可能です。
動作するOSは、Windowsほか、Macです。
なお、Windows用には、スタンダード版とプロ版があります。
OCR機能は両方とも搭載します。
ただ、透明PDFを作る場合、(画像としての文字の鮮明さ)は、カスタムフォント機能とClearScanのできないスタンダード版は、実用度・完成度において劣ります。
性能の詳しい違は、このブログの【PDF作成・編集ソフトの比較記事】の後半で書きました。また、学生版などお得な買い方は、先述のように【Acrobatのライセンスとお得な購入法】の記事ででフォローしています。
---
以上、Adobe Acrobatの紹介でした。
後ほど「実験結果」を検証しますが、(そもそも)細かい校正をするつもりがなく、透明PDFにして(ざっくりな)文字列検索さえできれば良い場合、本機は良いです。
先述のように、画像としての文字がベクターデータ化できるので、透明PDFとして視認性は、どの製品よりも良いですから。
【パッケージ版】
11・ソースネクスト本格読取 5
¥3,933 Amazon.co.jp (12/14執筆時)
【ダウンロード版】
12・ソースネクスト本格読取 5
¥4,378 ソースネクスト直販 (12/14執筆時)
言語:2言語
対象書体:
対象文字種:JIS第1水準(4000文字)
単語辞書:14万語
専門辞書:75万語
文章校正:
本格読取5は、ソースネクストの販売するOCRソフトです。
冒頭で見たように、読取革命を出す会社で、その廉価版な製品です。
対応する言語は、日本語と英語です。
日本語認識は、しかし、大きく差があります。
認識できる文字数は、読取革命と比して、JIS第2水準などに対応せず4000字です。
用語辞書も、専門辞書は75万ワードと機能が限定されます。
単語辞書も14万語ですから、差を付けています。
文章の出力は、ワード・エクセル・テキストファイルのみです。
PDF出力・透明テキスト化ができない仕様です。PDFは入力も不可です。
動作するOSは、Windowsのみです。
---
以上、本格読取5の紹介でした。
価格は「読取革命」より安いですが、機能性は、認識精度・出力の部分を含めて、価格差以上に開きがあります。
この程度の機能性で良い場合、各社のライト版(無料版)ほか、今だとGoogleドキュメントのOCR機能もありますし、そちらで十分という方も多いでしょう。
ーーー
なお、さほどOCRに特徴がないが、「おまけ機能として日本語OCR機能を持つという製品がほかにもあります。簡単に確認しておきます。
【2021年発売】
14・DocuWorks 9.1 ライセンス認証版
¥15,570 Amazon.co.jp (12/14執筆時)
第1に、DocuWorks 9.1です。
富士ゼロックスが販売する、オフィス用パブリケーションソフトです。
「Adobeのライバル」的なソフトで、複数のファイルを1つの規格のファイルにパッケージングすることがメインの製品です。
同社の販売するコピー機と一緒に利用すると便利です。
こちらも、Adobe社と同じで、「おまけ機能」として、OCR機能が付属します。
対応する言語は、10言語です。
日本語・英語・中国語(繁体字・簡体字)ほか、アジア言語(韓国語・タイ語、ベトナム語、インドネシア語、マレー語、タガログ語)に対応します。
認識できる文字数は、日本語の認識対象文字数はJISの第二水準のすべてを含んだ6700字です。
こちらは、e.Typistを販売するメディアドライブの販売用エンジン(活字文書OCRライブラリ v.9.5をベースとしたもの) の提供を受けているため、専門版と水準は同等です。
用語・専門辞書は、ただし、非搭載です。
この部分で、専門機と決定的な差はあります。
---
結論的にいえば、こうした点から言えば、オフィス用パブリケーションソフトとしてはたいへん優秀なソフトですが、本格的なOCRソフトとしては差があります。
ーーー
13・やさしく名刺ファイリング PRO v.15.0
¥7,491 Amazon.co.jp (12/14執筆時)
第2に、やさしく名刺ファイリング PROです。
名刺整理ソフトの草分けで、それに専門特化したソフトです。
先ほどみたe.Typistを発売するメディアドライブが取り扱う、名刺に特化した製品です。
スキャナなどで一括して取り込んだデータを、名刺管理データベース化することができる点で、ビジネスマンに人気です。
対応する言語は、日本語・英語です。
名刺の裏表の両面スキャンにも対応します。
認識できる文字数や用語辞書は、しかしながら情報が非開示です。
辞書は、未搭載だと思います。
ただ、名刺については、「名字の入れ間違いが致命的」になる類のものです。
この製品の面白い部分は、スキャンしたデータにOCRをかけるだけではなく、同社の「THE 名刺管理」というクラウドサービスで、500枚までの名刺データを目視チェック・訂正してくれる点です。
最近多い、漢字圏のアジアの国へ「アウトソーシング」する名刺サービスの一環ですが、精度の高さは確実にOCRを超えます。
---
結論的にいえば、名刺専用としては、評価できる製品です。
名刺取り込みは、(名前の間違いが、営業面で「致命的」になる点から)OCRだけで完璧に処理するのはやや難しく、「人の目のチェック」が必要です。こうしたサービスを利用するのが良いでしょう。
【2023年発売】
【通常版(日英翻訳)】
14・コリャ英和 一発翻訳 2024 for win
¥9,255 Amazon.co.jp (12/14執筆時)
【ビジネス・技術専門辞書パック】
15・コリャ英和 一発翻訳 2024 for win
¥18,282 Amazon.co.jp (12/14執筆時)
【 医歯薬南山堂パック】
16・コリャ英和 一発翻訳 2024 for win
¥35,464 Amazon.co.jp (12/14執筆時)
【マルチリンガル翻訳】(11言語)
17・コリャ英和! 一発翻訳 2025 for win
¥32,670 Amazon.co.jp (12/14執筆時)
【ベーシック版】
18・LogoVista PRO 2025 ベーシック
¥42,303 Amazon.co.jp (12/14執筆時)
【フルパッケージ版】
19・LogoVista PRO 2023 フルパック
¥95,252 Amazon.co.jp (12/14執筆時)
第3に、ロゴヴィスタのコリャ英和シリーズです。
PC用の翻訳ソフトとして、信頼性がある製品です。
最近はウェブ翻訳が全盛ですが、単語辞書の精度はやはり専門辞書も優秀で、Officeソフトへのアドイン機能など利便性も高いです。
なお、LogoVista PROは、オフラインの1,163万語レベルの翻訳辞書をもつ上位版です。フルパッケージだとさらに489万語の専門辞書を搭載しており、おもに業務翻訳の精度が上がります。
また、LogoVista PRO系のみ「OCRから翻訳まで同じ画面でシームレスな操作が可能です。
これらの辞書は、OCRソフトであるReadiris PRO for LogoVistaが付属します。
Readiris PROは、アメリカの多言語OCRソフトの草分けであり、信頼性がある製品です。
ただ、Readiris PRO for LogoVistaは、2011年段階のReadiris PRO 11相当です。
英語版の現行バージョンより相当古いです。
出力は、Wordを含むリッチテキストなので、透明PDFを作る用途には使えず、簡易的です。
対応できる言語は、日本語・英語・中国語(繁体字・簡体字)・韓国語ほか、ヨーロッパ系各言語を含めて31言語です。
認識できる文字数や用語辞書も、情報が非開示です。
---
結論的にいえば、翻訳ソフトとしては優秀です。
2021年モデル以降は、OCRを書けつつ翻訳処理できるようになり利便性も増しています。
ただ、OCRの性能自体は、そのソフトに読み込ませるための「おまけ」的な要素に止まります。
ーー
20・いきなりPDF STANDARD Edition Ver.12
¥4,290 Amazon.co.jp (1/12執筆時)
21・JUST PDF 6 (作成・編集・データ変換)
¥(6,090) Amazon.co.jp (1/12執筆時)
第4に、「いきなりPDF」などのPDF編集ソフトです。
Acrobatの互換製品といえるサードパーティのPDF編集ソフトです。
上位版となるこれらのグレード以上だと、OCR機能が(Acrobatと同じで)付属です。
こちらの場合も、用語・専門辞書はない水準です。
--
結論的にいえば PDFを作成する際に(ちょっと)文字列を検索可能にしたい程度の場合、こちらは値段面で候補にできるでしょう。
割と安く手に入るのは確かですので、PDF作成・編集ソフトを探している場合は候補になるでしょう。なお、これらの製品のPDF作成・編集機能については、このブログの【PDF作成・編集ソフトの比較記事】で紹介しています。
2・認識精度に関する実験
ここからは、ここまで紹介したソフトのうち、認識精度において、Atlasが「評価」した3ソフトについて、そのOCRエンジンの能力を比較していきます。
Atlasが過去に実験したもので、状態の良い文章、悪い文章などいろいろな素材を使って試しています。
なお、以下の記事では、特に断りのない場合、A4サイズ、グレースケール(ないしカラー)、400dpiの精度で取り込んでいます。
2-1:レイアウト認識の正確さ
はじめに、レイアウト認識力の正確さの検証実験です。
資料や本を取り込む場合、複雑なレイアウトなもの、写真と文章が混在しているものがあります。
ここでは、「写真は写真」、「文章は文章」と、しっかりきちんと「切り分けられる」かを実験します。
元とした画像データは、以上のものです。
わりと複雑なレイアウトですが、各OCRソフトはどのように認識するでしょうか?
第1に、読取革命です。
文字の精度はここでは観点とせず、あくまでレイアウト認識を比較します。
複雑なレイアウトをきちんと認識できているように見えますが、問題が1カ所あります。
つまり、右上の「朝食に」から始まる文章、実は「画像」と認識されており、OCR処理がかかっていません。元データを見て欲しいのですが、この部分だけ緑がかった文字色です。コントラストの違いから「画像と誤認識」されてしまったようです。
なお、画像に枠線がついていますが、これはソフト上の表示で、アウトプットの段階では表示されないので安心してください。
ーーー
第2に、e.Typistの場合です。
こちらは、右上の「朝食に」の部分を含めて、綺麗にレイアウトを認識できています。
さらに、文字の間隔もスクリーン上、見やすく配置されています。
なかなか優秀だと思います。
ーーーー
第3に、Acrobatです。
Acrobatは、編集機能が無いので、OCR化したあとで、認識結果をWordファイルに変換したものを表示しています。
レイアウトについてはほぼ問題ありません。専門のOCRソフト並みの健闘を見せています。
結論的に言えば、日本語横書きの認識がメインならば、(有料版の)Adobe Acrobatでも十分です。
先述のように、Acrobatで検索可能なPDFを作る場合、PCの画面に表示される文字も「ベクター化」してスクリーン上で見やすくしてくれる(ClearScan)機能を搭載します。
この点からも、閲覧/検索兼用のPDF作成には、Adobe Acerobat はかなり向いています。(なおアクロバット最新版では、「Clearscan」は、日本語訳されて「編集可能なテキストや画像」と名称変更されています。
2-2:横書き文章の変換精度
つづいて、横書き文章の精度についての検証実験です。
ビジネス書類に多いパターンですので、研究者以外に、ビジネスマンにも重要です。
元とした画像データは、以上のものです。。
画像は粗めで、レイアウトも複雑ですが、OCRソフトはどのように認識するでしょうか?
第1に、読取革命です。
表示しているのは「読み取り結果」の画面です。
問題なく、きちんと認識されていると言えるでしょう。
100%認識できているといえます。優秀です。
ーーー
第2に、e.typistです。
こちらも精度が良いです。「1」の数字だけ「且」に文字化けしている点です。
もしかすると、近辺の「具」という文字との類推を考えたのかもしれません。
ただ、これは誤差レベルであり、読取とほぼ互角の性能といえます。
ーーー
第3に、Acrobatの場合です。
こちらも、
このように、横書きの文章は問題なく認識できます。優秀と言えるでしょう。
繰り返しますが、「横書きの認識性能」については、Acrobatはかなり優秀です。
ーー
実は、これには事情があります。2015年頃から、自力でOCRエンジンを開発できる日本の「ソフトメーカー」が、総じて、OCRソフトの年次更新(新バージョンの発売)を止めてしまいました。(だから「ver15」なのです)
Adobeは、せっせと機能革新をしているため、今後も差が開きかねない状況です。実際、英語圏のOCRソフトは、リッチテキスト認識に移行して久しく、「明朝体」「ゴシック体」など字体の判別もできます。
一方で、日本のOCRはその水準にいくまでに「進化を止めて」います。「読んDEココ」などが実質撤退したことをふまえると、既存メーカーを責めることはできません。
どちらかといえば、国が助成金をつけてやるべき仕事でしょうね。
2-3:縦書き文章の変換精度
ここからは、縦書き文章についての検証実験です。
元のデータは、以上のものです。
すこし「意地悪」して、2段組の縦書き文章にOCRをかけてみました。
実験のポイントは、段組をきちんと把握しているかという点と、認識精度になります。
第1に、読取革命です。
上図のように、段組をきちんと把握できています。
2段目の最後の「時ノ容姿」が「吟ノ容姿」になってしまっている以外は、ほぼ完全に認識できています。
ーーー
第2に、e.typistです。
ほぼ完璧に認識できています。
状態の良い文章についてはe.typistの健闘が光ります。
ーーー
第3に、Acrobatです。
残念ながら、このフィールドを文字であると認識できず、画像として認識しました。
実は(ここまで激賞してきた)Adobe Acrobatですが、日本語の縦書きは「壊滅的な状況」にあります。
2-4:縦中横の変換精度
続いて、縦中横(縦書き文章のなかに混在する横書きの英語文字)んの変換精度の実験です。
元のデータは、以上のものです。
実験のポイントは、collégeをきちんと把握しているかと、認識精度です。ちなみに原文のeはフランス語綴りでéです。少し意地悪をしてみました。
第1に、読取革命です。
「é」は認識できていません。しかし、きちんと文字を認識しています。
なお、縦書きになってしまっていますが、これは、透明テキストとしてOCR処理する分には通常の動作で、むしろこのようになっていないと困る類のものです。
ーーー
第2に、e.typistです。
残念ですが、全く英語の部分を単語として認識していません。
今回のバージョンから「対応」とメーカーは表明していましたが。しかし、実際の所は「からっきし」でした。
一応他の部分もためしたけれど、うまく変換されませんでした・・・。学術論文の脚注の英語論文表記は基本このような形式なので、研究者には致命的でしょう。
ーーーー
第3に、Acrobatです。
先ほど書いたように、日本語の縦書きについては、ほぼ認識は不可能です。
2-5:和英混在文書の変換精度
ここからは、脚注など横書きで英語と日本語が混在する文章の検証です。
元のデータは、以上のものです。
ポイントは、英語の部分の認識と日本語部分との境界の把握です。
第1に、読取革命です。
英語の単と単語の間の字間はきちんと認識できており、日本語との区分もついています。
しかし、主にイタリック体の部分を中心に英語認識が「壊滅的」です。手動でこの部分を「英語」と指定してから処理すれば少しは「まし」です。
しかし、日本語と混在している場合は「英語」としていすると、日本語部分が文字化けしてしまいます。
なお、読取革命は2020年10月下旬に英語エンジンを提供するAbbyyの認識精度のオンラインアップデートがありました。
上表の出力データはそれ以前の精度ですが、この部分は日本語OCRの精度に関わる部分なので、大きくは改善しないでしょう。
ーーー
第2に、e.typistです。
イタリックの部分がほぼ壊滅です。
さらに英単語と英単語の間の半角スペースの認識がほぼ欠如している様子です。
単語が単語と認識できていない点で、読取革命より劣ると言わざるを得ないでしょう。
ーーー
第3に、Acrobatです。
日本語モードで認識した場合は、英語の部分が横書きでも認識ができないようです。
画像として認識され、OCRがかかりませんでした。英語としてOCRにかければ、英語の部分はかかります。
2-5:状態の悪い文書の変換精度
続いて、かなり状態の悪い文章の認識について検証します。
元のデータは、以上のものです。
「電話帳サイズ」の本から、コピー機でコピーした原稿をスキャニングしたデータです。
こちらは、元データは白黒2値になります。見た感じ分かるようにかなり状態が悪い原稿です。
この論文の上記の部分の認識精度をみてみます。
第1に、読取革命です。
英語の部分はご愛敬として、日本語の部分はかなり健闘していると言えます。
英語の部分は基本的に諦めるしかない状況です。
ーーーー
第2に、e.typistです。
レイアウト認識を含めて壊滅的です。
e.Typistは状態の悪い原稿は昔から苦手で、このようになることが多いです。
そのため、コピー論文などのOCR化については全く期待できない状況なんですね。日本語だけの文章でも、状態の悪い物は読取革命のほうが性能がかなり良いと言えます。
ーーーー
第3に、Adobe Acrobatです。
やはり状態の悪い原稿は無理でした。横書きで状態の悪いものについても壊滅的な状況でした。
2-6:作成されるファイルサイズとPDFの画質
最後に、作成されるPDFファイルのサイズと、画質面のクオリティについて、書き加えておきます。
今回の実験では縦書きの日本語のハードカバーのPDF(グレースケール600dpi)を30ページを透明PDFにしました。なお、元の画像PDFファイルは1.8MBでした。
読取革命
通常圧縮=15.7MB
高圧縮=3.9MB
e.typist
通常圧縮= 2.4MB
高圧縮=1.7MB
Acrobat
通常圧縮= 7.4MB
Clearscan=2.2MB
ファイル圧縮率は、上表の通りです。
ファイルサイズの点で優秀なのは、1.7MBまで圧縮できるe.typistですが、画質はどうでしょう。
以下で比べてみます。
第1に、e.typistです。
上図は、高圧縮(1.7MB)で作成した認識結果を400%に拡大表示したものです。
圧縮後の表示画質の点でも、及第点だと思います。
一方、通常圧縮したものがこちらです。
比較する場合、高圧縮よりファイル数が大きい(2.4MB)割に視認性はさほど高くないです。
e.typistの場合、中間域の色を排除した高圧縮率ファイルのほうが、文字については視認性が良いです。これは、驚きの結果でした。
ーーー
第2に、読取革命です。
上図は高圧縮(3.9MB)した際の認識結果を、同じように400%に拡大表示したものです。
圧縮率はあまり良くないですが、クオリティはe.typistと変わらず高レベルと言えます。
画像の階調も、e.typist(左)と読取革命(右)はさほど変わりませんでした。
一方、上図は、読取革命で、通常圧縮したものです。
ファイルサイズは15.7MBと大きめですが、e.typistと違って通常圧縮の方が「文字のカクカク」が少なく、相応にクオリティは良いと言えます。
ーーー
第3に、Acrobatです。
こちらは、AcrobatのClearscanをかけて処理したファイルですが、同じように400%に拡大表示したものです。
先述のように、このソフトの場合、画像としての文字もベクター化(=疑似フォント化)されるので、鮮明さは、群を抜きます。ベクターデータなので、拡大した場合も整っており、見やすさでは群を抜きます。
ファイルサイズも2.2MBと小さくなります。
---
結論的にいえば、限られた実験結果ではありますが、読取革命とe,typistを使って、高圧縮PDFを作る場合は、視認性はほぼ互角です。
ファイルサイズの点ではe.typistが多少有利でしょう。ただ、その代わり、e.typistは圧縮率の少ないPDFを作るのは不得意です。
AcrobatのClearscanは、視認性やファイルサイズの点では群を抜いて良いです。
この点でも、状態の良い原稿を透明PDFにするならば、このソフトが最高と言えます。バックグラウンドのテキストを編集しないならば、こちらが良いでしょう。
なお、読取革命もe.typistも、ソフトへのPDF入力時に400dpiまでダウンスケーリングされます。読取革命は標準では300dpiですが、今回の実験では400dpiに設定変更して比較しました。
今回の結論
信頼できる日本語OCRソフトは結論的にこれ!
というわけでOCRソフトをいくつかの観点から比較してみました。
最後に、いつものように、目的別におすすめのOCRソフトを提案していきたいと思います。
第1に、本格的な日本語OCRソフとして現状でおすすめできるものは、
【2024年発売】
(ダウンロード版)
1・ソースネクスト 読取革命 Ver.17
¥8,980 ソースネクスト直販 (12/14執筆時)
(パッケージ版)
1・ソースネクスト 読取革命 Ver.17
¥9,700 Amazon.co.jp (12/14執筆時)
(ダウンロード版)
1・ソースネクスト 読取革命 Ver.17
¥12,980 Amazon.co.jp (12/14執筆時)
言語:日本語・英語
対象書体:5種類以上
対象文字種:JIS第2水準(6800文字)
単語辞書:18万語
専門辞書:61万語
文章校正:AIトータルアシスト
認識精度(日本語)★★★★★
認識精度(英語) ★★★☆☆
レイアウト認識力 ★★★★★
縦書きの認識力 ★★★★★
文字の見やすさ ★★★★☆
総合評価 ★★★★★
読取革命 17がおすすめです。
先述のように、OCRエンジン自体の進化は、業界全体で停滞しています。
しかし、UIを含めて使い勝手の向上は評価できます。
特に本機の場合、「自然な文章に」修正するAIトータルアシスト機能は目新しく、使い方によっては作業効率が向上しそうな部分で評価できます。
OCRエンジンの部分も、他社機と比べても精度がないです。
レイアウト認識は、各機通しても最も良いです。
雑誌や本など、レイアウトが複雑なものへの対応力があります。
横書きの英語混在文書の場合も読取革命の方が良いので、研究者などにも相性は良いでしょう。
詳説や雑誌などの2段組の文章などは、ストレスなく取り込めます。
状態の悪い原稿は、特にこのソフトは強いです。
文字パターン辞書多めで、潰れ文字の認識性能が高いためです。
新聞も、色味のある原稿に強めで、縦書きの精度が良い部分で、おすすめできます。
むろん、通常の会議資料もしっかり対応するので、色々な取り込みにマルチに使えるでしょう。。
なお、直販だと、セール時期には「ユーザー割引」をします。
実施の有無と価格は、会員登録の後にしか見れないのですが、無料の登録さえすればみれます。買われる場合は、チェックしてもよいかなと思います(こちら)。
ライセンス数(3台・5台)による割引もあります。
ーーー
【2013年発売】
【パッケージ版】
7・e.Typist (アジア言語対応)v.15.0
¥14,209 Amazon.co.jp (12/14執筆時)
【ダウンロード版】
8・e.Typist (アジア言語対応)v.15.0
¥13,666 Amazon.co.jp (12/14執筆時)
言語:58言語
対象書体:10種類以上
対象文字種:JIS第2水準(6800文字)
単語辞書:6万語
専門辞書:150万語
文章校正:
認識精度(日本語)★★★★★
認識精度(英語) ★★★☆☆
レイアウト認識力 ★★★★☆
縦書きの認識力 ★★★★☆
文字の見やすさ ★★★★☆
総合評価 ★★★★★
一方、会議資料など、比較的新しく状態の良いものの認識させる場合、e.Typistも精度が良いです。
とくに、英語の混在しない文章、状態の良い原稿からの読み取りに限られるならば、e.Typistは選択肢になります。
特に専門性の高い文章は、150万の専門用語辞書の分だけ精度が出せています。ただ、これは「読取革命」も含めてですが、辞書の更新がないので、新語については、さほどの差は出ません。
このほか、ファイルの圧縮率の部分でも本機は優れる部分があります。
ファイル容量は今どきだと問題になりにくいでしょう。しかし、多くのページ数のあるPDFを(CPU・GPU的に)軽いPDFを作りたい場合は、やはり選択肢にできます。
第2に、テキストが検索できる画像PDF(透明PDF)を作る方で、ディスプレイ表示の「みやすさ」を重視したい方に最適なのは、
〈オンラインコード版〉
10・Acrobat pro 12ヶ月版
¥21,312 Amazon.co.jp (12/14執筆時)
言語:13言語
対象書体:
対象文字種:
単語辞書:
専門辞書:
文章校正:
認識精度(日本語)★★★★☆
認識精度(英語) ★★★★☆
レイアウト認識力 ★★★☆☆
縦書きの認識力 ★★☆☆☆
文字の見やすさ ★★★★★★
総合評価 ★★★★★
Acrobat Proが良いでしょう。
言うまでもなく、Clear Scan機能が理由です。
透明PDFに表示される「画像としての文字」が(見かけがかわらないまま)「疑似フォント化(ベクター化)」されるので、文字のギザギザが取れ格段に読みやすくなるからです。
ファイサイズも、「疑似フォント化」で格段に小さくなります。
「元原稿の状態が良く、かつ横書きの英語か日本語限定」、という制約は付きますが、その条件の下では、最も良いといえます。
とくに、PDFファイルを作成したあと「目で見て読む」場合、圧倒的に快適なのはこの方法です。
ただし、Acrobatで作成した透明PDFは、後から認識ミスを変更できません。
認識後に手動で直すなどしたい方は、読取革命などを選ばれた方が良いと思います。また、OCR専用ソフトではないため、詳しい説明書などもありません。
そのため、OCR初心者の方は、(慣れるまで)最初は読取革命などを選ばれることをおすすめします。
なお、このソフトの機能性は【おすすめPDF作成ソフトの比較記事】でも、他社ソフトとの違いを解説してます。
また、格安購入法については、【Adobe Acrobat のライセンス数と割引購入法】で、それぞれ記事化しています。
興味のある方はご覧ください。
補足・本の自炊関連記事の紹介
というわけで、今回は日本語OCRの比較でした。
なお、このブログ「モノマニア」では、最新モデルの自炊に関係する機材について、以下のような記事があります。
1・ドキュメントスキャナーの比較
2・ブックスキャナーの比較
3・裁断機の比較
4・ディスクカッターの比較
5・本の自炊の手順と必要機材【まとめ】
OCRをするために、機材も一緒にお探しの方ご参考になさって下さい。なお、機材を選ぶ場合の、「おすすめ」の詳しい手順については、5番の「まとめ記事」で紹介しました。
最後になりましたが、記事がもしお役に立ったようならば、以下のTwitter Facebook はてなブックマークボタンなどから記事を共有していただければうれしいです!!(↓)