本を配布する〜「青空文庫」の仕組みを利用する

世界文化の古典(著作権がきれたものやpublic domainと宣言されたものなど)をテキスト化または読み上げして公開するProject Gutenbergは世界的に有名です。 今日では、たとえば 奥の細道 など日本語作品も多く収蔵されています。

その日本版といえるのが青空文庫で、主に文学作品のテキスト化するボランティア活動によって支えられています。

青空文庫のテキストを利用して、それを電子書籍として閲覧するためのさまざまなソフトウエアがあります(現在、青空文庫に所蔵されているテキスト全ては「まだ」百数十MByte程度であり、スマートフォンに一括保存できる分量あり、日本を近代的古典を堪能することができる。強くその利用を勧めたい。

青空文庫に収録するためのテキストファイルは青空文庫形式従わなければならない。 しかし、決して複雑なものではない。 ルビは『塵埃《ほこり》』というよう記載し、ルビの付く文字列の始まりを特定する記号を「|」として『日華|蛋粉《たんぷん》』と記述。返り点は『浮雲似[#二]故丘[#一]』など形式でテキスト化する、などである。

文学作品だけでなく、理科の書籍を考えると通常のテキスト化だけでは困難がある。 実際、高木貞治の青空文庫化は始まっているが、数式が多用された書籍では現在の方式では限界がある。 そこで、LaTeXへの相互変換が容易でWebページで数式を表示可能なMediaWikiを使う高木貞治プロジェクトなどが始まっている。 アメリカ数学会は、Web上の数式表記のためのプロジェクトMathJaxを推進している。

電子書籍へ

古典を青空文庫Project Gutenbergとして世界の共有財産とする作業はきわめて意義深い。 ここではそのアプローチから離れて、自らの著作物を配布するためにこれらの仕組みを利用するという方向を考えてみよう。 これには3つの方向がある:

青空文庫形式ファイルをPDFファイルにする

青空文庫形式のテキストファイルを、TeX形式に変換してPDFファイルにする手順を紹介します

参考
青空文庫を読もう!
青空Kindleで読む

以下の作業環境が必要になります。

青空文庫形式の「病牀六尺」をPDFに

ここでは、例として正岡子規の「病牀六尺」をA5半のPDFファイルに変換してみよう。

青空文庫形式のテキストファイルのTeXファイルへの変換の手順は青空文庫を読もう!に書かれている(Rubyが使える環境下であっても、ダウンロードしたスクリプト aozora.rb を使って byosho_rokushaku.txt をTeXファイルに変換する箇所が技術的に難解と思えるユーザも多いはずだ)。

以下では、Mac OSの場合にデスクトップにあるフォルダ masaoka で作業することを想定して、簡単に手順を説明します。

  1. 青空文庫からダウンロードした青空文庫形式のファイル byosho_rokushaku.txt および「青空文庫パッケージのダウンロード」に含まれる 1010crop.sty, aozora.sty, aozora.rb, logo.eps をフォルダ masaoka に移動。 furikana.styも移動しておく。
  2. 1010crop.sty, aozora.sty, furikana.sty の文字コードを TeXシステムの文字コードに合わせてエディタなどを使って変換しておく
  3. ターミナル.appを起動して

    % cd Desktop/masaoka  <-- デスクトップ内のフォルダ masaoka に移動
    % chmod +x aozora.rb  <-- スクリプト aozora.rb に実行属性を設定
    % aozora.rb byosho_rokushaku <-- 青空文庫ファイルをTeX形式に変換を実行
    
  4. 変換して得られたTeXファイルの文字コード(ISO 2020-JP)をTeXシステムの文字コードに合わせてエディタなどを使って変換する
  5. TeXShopで byosho_rokushaku.tex を開いて、一行目のオプション twocolumを指定デス、次のように書き換える

    \documentclass[a5paper]{tbook}
    
  6. このままタイプセットすると 19行目でエラーが発生。 ファイル全体から、文字列 "\advance\rightskip" を検索して空文字列に全置換する([編集]/[検索]/[検索パネル]で検索文字列を"\advance\rightskip"、置換文字列を空 "" にして、全て置き換えボタンを押す)。
  7. タイプセットすると730行目でエラーが発生。 TeXshopで730行目で、"\end{jisage}" を次のようにコメントアウトする(あるいは削除する)。

        青々%\end{jisage}
    
  8. タイプセットに成功して254ページのA5サイズのPDFファイルが得られる。
  9. ファイル全体から、"2zw" を検索して空文字列に全置換する(変換時のゴミ)。

以上の過程で最終的にタイプセットするTeXファイルと得られたPDFファイル