IT号外

PDFやJPG、PNGなどの画像内にある文字を、テキストデータとして取得する方法とその応用。デスクトップ版グーグルレンズの使い方

いやはやここ最近、度肝を抜くようなニュースを見ましたよ。こちらの記事です↓

http://jin115.com/archives/52345307.html

グーグルレンズというGoogleのサービスについて述べられています。

グーグルレンズと言えば、あー、あのAndroidスマホにプリインストールされているGoogle製のQRコードリーダーねー。あーはいはい。といった感想しかありませんでした。私が悪うございました。

上記記事を読んで、初めてこのグーグルレンズという機能は、iPhoneでいうところのカメラを英文にかざせば日本語の文章になるという機能を有したものだと知りました。

そして、普通にスマホに入ってるアプリだと思っていたけど、Chromeの中にこの機能が内包されているという事も初めて知った。

まあ簡単な概要は上記記事を見てもらうとして、ここではもう少し突っ込んだ使い方説明と、応用的な使い方を実験&解説してみたい。

まずは適当な英文が書かれた画像データを用意。こんな感じのものをネットで拾ってみた↓

デスクトップに適当な名前を付けたフォルダを作り、そのなかにこの画像を入れる。

次に、ChromeのURL欄に、作成したフォルダのパスを入れて開く。するとブラウザ内でフォルダが開き、上記画像を開けるようになる。

これでローカルパソコンに保存している画像をグーグルレンズで指定できるようになったので、画像を右クリックして早速グーグルレンズで開いてみる。

するとこんな感じの画面が右側に出る↓

「検索」「テキスト」「翻訳」という3つのボタンでグーグルレンズの機能を使う。シンプルで分かりやすいが、一番出番の少ないであろう「検索」ボタンがトップで開くUIは正直いただけない。

ではまず「翻訳」ボタンを押してみよう。

こんな感じで翻訳できる。

次に「テキスト」ボタンを押してみる。

使っているディスプレイの高さが低いと、テキストボタンには何も機能が搭載されていないように見える。しかし下へスクロールすると、

テキストをすべて選択、というボタンが出てくるのが分かる。それを押してみる。

すると、テキストをコピーというボタンが出た。その右側にある下向き矢印のアイコンを押してみる。

すると、こんな感じで読み上げのボタンが出て、英文を読み上げたり、翻訳した日本語の文章を読み上げたりすることができるのだ。

とまあ、ここまでが一連の使い方なのだが、坦々と説明するとあまりすごさが伝わらないかもしれない。

まず何がすごいのかと考えると、自分が中学校、高校の時は、英文を日本語に翻訳するといった宿題や課題が当たり前のようにあった。それらが丸々、スマホ(またはChrome)を使えば頭で考えなくても一瞬で日本語に変換できるようになったのだ。日本語文から英文への翻訳だってお手の物だ。つまり自分が苦労してこなしていた英語の宿題のほとんどがスマホがやってくれるという事態になっている。

次にすごいと思うのは、テキストデータを抽出できるということは画像データから音声データへ変換できるということだ。つまり、PDFやJPGからMP3へ変換できるのだ。これは英語リスニングのトレーニングには高い効果を発揮するツールとなり得る。

例文の音声ダウンロードデータが付いていない英語の参考書とかでも、スマホをかざすだけで英文のリスニングができてしまうのだ。

(なお、PDFにはアクロバットリーダー自体に元々データ内のテキストをテキスト化するOCR機能が付いている。多分有料?)

などなど、これらの事をさらに応用していくと、日本語訳が出版されていない洋書なども(文学性はさておき)日本語に翻訳して読む事ができるのだ。翻訳家を雇わなくてもだ。

さらに、音声データも作れるので、日本語訳が出版されていない洋書に対して、日本語で読み上げるという離れ技、いわゆるオーディブル音声データの作成もやろうと思えばできてしまうのだ。

まあそういった場合は1ページ1ページスクショを撮って画像を読み込ませなければならないので、時間と根気の要る作業になってしまうが、そういったビジネスもある意味やってみたいと思っている。

いやはや自分が小学生の時、つまりは昭和時代のOCRといえば、白いスクリーンにグラフなどの静止画を映し出すためだけのクソでかいプロジェクターが、授業中にズカズカガラガラと教室に運び込まれるというシロモノだったのに、あれから30年。まさかここまでの技術に進化するとは。すごいゾ、OCR君!!


追記:

プロジェクターの名前はOCRではなく、OHPの間違いでした。。オーバーヘッドプロジェクターというものだったらしいです↓

モバイルバージョンを終了