「私刑類纂」の作業について

そんな訳で私刑類纂の影印本(光学スキャンによる複製本みたいなものだと思って下さい)を入手したのは11月13日でした。既にこの日から今日の時点で2週間以上が経過しています。作業は色々とありましたが、基本的には旧仮名遣いと旧漢字との戦いになります。「猥褻風俗史」と比較すれば、総ルビでないので楽なものです。分量はありますが、割と快適に作業できます。

つまり、「猥褻風俗史」や「スコブル」といった本は総ルビなのです。こうなってくると作業量3倍以上になります。

影印本は勿論Scansnapで取り込みます。ハードカバーだろうが数十年前の本だろうが構うことはありません。カッターで背を切り落とし、さくさくと裁断してばりばりスキャンします。

2013 11 28 20 43 50

この時点で加藤さんを始めとした方々には驚かれてしまいました。いいじゃん。オリジナルじゃないんだし、という気持ちでしたが、僕は後にもっと心痛むことをすることになります。てへ。

スキャンはScansnapの「エクセレント」で、白黒2値で取り込みました。グレイスケールやカラーだとさすがに一枚の容量が大きすぎるかと懸念したためです。

だいたいこんな感じになっています。

スクリーンショット 2013 11 28 20 50 48

見ての通り、内容が酷い(褒め言葉

これらの取り込んだファイルは各ページ毎に保存して、OCRに掛けました。作業は加藤 (@azukiglg)さんに依頼。作業開始となりましたが、これからが結構難航する点が続出するのでした。ここら辺の作業はまた今後ご紹介します。

「私刑類纂」の作業雑感

Figgai01 01

竹の子書房という電子書籍研究団体があります。神沼も参加しているのですが、そこで暫く前から宮武外骨の著作を電子的に復刻しようという話になっているのです。

現在、加藤一 (@azukiglg)さんが中心になって「猥褻風俗史」という本の入力が行われています。

IMG 0002

そして僕の方は「私刑類纂」という本を入力しています。ちなみに「私刑類纂」は近代デジタルライブリーでは公開されていません。

どちらにしろ明治大正時代の古い本ですし、既に外骨先生は亡くなって50年以上経過していますので、著作権保護の対象ではないのです。なのでこれらは自由に販売しても良いのですよ。そんな訳で色々と作業しているのです。というか読むのと同時並行で打ち込んでいるというか。

だいたい一日に1ページ。忙しい日は打ち込めない日もあるのですが、少しずつ進めています。

現状は138ページある本の45ページまで打ち込んでいます。まだまだ直しを入れたりもしますので、来年の春くらいまでは掛かるでしょう。

Figgai01 04

挿絵もひどいことになってますなぁ。