ITの小技、裏技、スキルアップ Web社会 ライフハック 日本の社会 起業、副業、新しいビジネスアイディア

オーディブルの自炊、書籍の朗読読み上げ音声を自作できるのかやってみた

投稿日:2021-07-20 更新日:

その昔、自分が小学生だった頃、母の言ったある言葉が面白くて未だに覚えている。それは、市立図書館の本棚の端から端まで全ての本を全て読破するのがお母さんの夢なんだよ、ということである。

ところが、、当然その夢は達成されることなく、今では日がな一日テレビのバラエティ番組を見てギャハハハと笑い転げている毎日である。まあテレビ番組表の隅から隅まで見るという部分は共通しているが。

恐らくだけど、老眼となっていて、読書どころではないのだと思う。しかし、本は読まないが、ラジオは結構聞くのだ。なので、自分はこのAudibleという代物が、いわゆるビジネスパーソン、社会でバリバリ活躍してて時間がありません的な人よりも、高齢者の方が活用の機会がかなり多いサービスなんじゃないかなとかねてより思っているのだ。

とはいえど、読書好きや新しい物好きの人なら既にご承知の通り、オーディオブックなるサービスは非常にラインナップ(対応作品数)が少ないのだ。それもそのはず。プロのナレーターが本を一冊丸々読むんだから、一人にかかる労力は結構なものになる。それに加え、Amazonでオーディブル化するのは比較的新しい本ばかりだが、実際高齢の人達が読みたいのはそれほど新しい本でもなく、どちらかというと古い本の方がいいっていう人が多いだろう。

いや、我が国はこれほど声優志望の男女が溢れているんだから、その人達にパートパートでリレー的に読んで貰って、朗読音声データを繋げ、参加者に売り上げを分配できるしくみとかあればそれもある意味いい感じで効率化できそうなイメージもあるが、現実的にはまだ無理そう。。

そんな事もあって、2018年にKindleの自動音声機能を使って初めて試しに本をアプリ上の声で読み上げてみたのだが、それはそれは酷いもので聴けたもんじゃなかったのだ。

そして最近ふとこの事を思い出してネットで何気に検索してみると、勝間和代さんの動画がでてきた。Androidのトークバック機能の使い方実演、デモを披露している。

さすが勝間女史。。自動音声をテレビ出力で聞いているとは恐れ入る。あれから3年も経過しているので音声も若干改善してきたかなあと思い、3年越しに再度機械音声の読み上げ実験に着手することにした。そしたらこのような感じになった。

著作権フリーの、宮沢賢治の銀河鉄道の夜と、あと実用書としては自分のKindleに入っていたアフター・ビットコインという本を実験材料とした。まあ引用という形でご了承いただきたく。pdfファイルをOCR経由でテキスト化すれば、理論上一冊まるごと読み上げることが出来るので、古い本やオーディブルに対応していない本でも聞くことが出来る。

読み上げた文章は下記の通りだ。

「ではみなさんは、そういうふうに川だと言われたり、乳の流れたあとだと言われたりしていた、このぼんやりと白いものが本当は何かご承知ですか?」
先生は、黒板につるした大きな黒い星座の図の、上から下へ白くけぶった銀河帯のようなところを指さしながら、みんなに問いをかけました。
カムパネルラが手をあげました。それから四、五人手をあげました。ジョバンニも手をあげようとして、急いでそのままやめました。たしかにあれがみんな星だと、いつか雑誌で読んだのでしたが、このごろはジョバンニはまるで毎日教室でもねむく、本を読むひまも読む本もないので、なんだかどんなこともよくわからないという気持ちがするのでした。
ところが先生は早くもそれを見つけたのでした。
「ジョバンニさん。あなたはわかっているのでしょう」

ビットコインが一大ブームとなっています。いわゆる仮想通貨法の施行や分裂騒ぎを経て、価格は大幅に上昇しており、ビットコイン投資の裾野も広がりを見せています。しかし、この辺で一度立ち止まって、冷静に事態を見てみる必要があるのでは無いでしょうか。仮想通貨のブームがまだ続き、ビットコイン本やブロックチェーン本が次々と出版されている中で、「ビットコインはもう終わった」と言わんばかりの「アフター・ビットコイン」という題名の本をあえて書いたのは、以下のような理由によるものです。
1つ目は、ビットコインについては、「通貨の未来を変えるもの」として、非常に美しい姿ばかりが宣伝されていることに懸念を覚えるためです。ブームを盛り上げたいサイドによる書籍や記事が多いこともあって、新鮮な仕組みの魅力や、値上がりに繋がるような明るい未来が強調されています。物事には必ず表と裏の両方があるはずですが、これまでは「ビットコインの光と影」のうち、美化された光の部分のみがクローズアップされる傾向がありました。

最初に流れるKindleの音声は、Kindleから流れている音を別のスマホのレコーダーで録音したものなので、実際はもう少し音質は良い。また、KindleとWindows 10の音声は女性ボイスのみなのに対し、AI(機械学習音声、ディープラーニング)のほうは男女どちらでも選べる。Windows 10は、EDGEの読み上げ機能でやってる。

フィクション、いわゆる小説となると、漢字をあえてひらがなにしていたり、あえて句読点を付けなかったり、その本の中だけの固有名詞が多いこともあって、一応内容は頭に入っては来るものの、やはりまだ完璧に世界観に没入できるとは言い難い。

一方、実用書、新書となるとかなり読み上げの精度は人間に近づいており、十分内容を理解できるレベルに達しているのではないかということが分かる。

ということで、自分はこれをビジネスにしたいなあと考えたのだ。本の画像自炊業者は数あれど、朗読音声を自炊代行して提供しているところはまだないなあと思ったからである。ネットで少し調べたが、紙の本の自炊は判例がでていないからグレーになっているだけで、結構黒に近いグレーであるということが分かった。うん、確かに紙をPDFにするのは元のものと同じものを作っている訳だから「複製」になるよね。では音声ではどうか。音声だと全く元の形態とは異なるし、そもそもコロナ禍になる前は、随所で朗読会が頻繁に開催されていた。なのでこれはコピーではなく、私が本の読み聞かせをしているという、朗読会のいち形態なのだ。

このように、本をラジオとして聞く、テレビを見るように本を聞くということが普通になれば、世の中の相当な量の本の内容が人の脳の中にインプットでき生産性も上がるし、本の売り上げだって上がるはずだ。ということで、これからもこの実験は続けてみようと思う。続報があればまた書きます。本の音声化をして欲しいというかたがいれば、メッセージ送信ボタンからメッセージお待ちしております。

-ITの小技、裏技、スキルアップ, Web社会, ライフハック, 日本の社会, 起業、副業、新しいビジネスアイディア
-, , , , , , , , , , , , , , , , , ,

Copyright© IT号外 , 2021 All Rights Reserved Powered by STINGER.