竹の子書房文庫表紙ジェネレータ

結局よくわからないままなので、GDを使って何とかしましたよ

縦書きについては今はお預け。タイムアップ。

あとはタイトルの長さが長くなったらはみ出すとか、自動改行しないとか、自動リサイズしないとか、色々問題は山積しているのだけど、今日のところは疲れたのでここまでにします。

こんなのを作れますよ
こんなのを作れますよ

特に竹の子書房関係者の方は遊んでみてください。そのうち帯の色を変えられるようにするくらいはするかもしれません。

少しバランスを修正しました。

今まさに肩こりひどいです
今まさに肩こりひどいです

TCPDFでごにょごにょ

最初はそんなに難しいものだとは思わなかったんですよ。
KDP用に簡易表紙が作れればいいなって。

ちなみにKDPの表紙は縦横比16:10だそうですよ。で、長辺が2500pxという巨大なファイル。
ほら、テキストで文章を持っている人も沢山いらっしゃるから、本文は作れると思うんです。でもね、表紙が無い訳で。
そうなってくると自動的に簡易番の表紙を作るサービスが欲しいんですよ。

ええ、神沼はプログラミングができません。

だから、ネットにあるいろいろなものを組み合わせて、何とか出来ないかなって。

いや、縦書きって大変ですわ。最初はGDというのがいいかなと思って、ImageTTFTextというので縦書き出来ないかなって感じに情報を探したんですが、あまりよく分からない。

ああ、縦書きならPDFの方が得意なんじゃないか? PDFを作ってからPNGに吐き出して、そこからGDで体裁を整えるというのはどうだろう? なんて感じにウロウロと半日ぐらいの時間をかけて探し回って、結局たどり着いたのはTCPDFです。

まだ何も出来てません。いやー。わかる人にはちゃちゃっと作れるようなものなんだろうなーと思うと、何だか悔しいですね。

Posted from するぷろ for iOS.

外骨文庫:私刑類纂の作業進捗(13.12.02)

神沼も所属している電子書籍発行研究団体である竹の子書房で行っている「宮武外骨の著作を寄ってたかって電子的に復刻しちゃうぞ企画」、通称「外骨文庫」の作業についてご報告しますよ。

本日の作業はOCRで取り込んだデータから、1ページ分の記事を修正しながら読んでいくというもの。読みながら圏点(傍点とか丸傍点とか白丸傍点とか)やルビを打ち込んで行く作業を行いました。

基本的には作業はこの繰り返しです。OCRの成功率が低いので、結局人手による修正が必要です。一日1ページ作業したとしても、138ページありますから、作業従事者が一人なら半年がかりの作業になります。

作業を行った後で、EPUB形式でも書き出して今日の作業は終了。これは後でまた時間を取って本文を読み、誤字などを抜き出す作業のためです。EPUB形式にしておけば、様々な環境で読めるのが強みです。

本日の作業結果の一部
本日の作業結果の一部

先はまだまだ長いです。

「 猥褻風俗史」をスキャンするの巻

寄ってたかって宮武外骨の著作を電子化しようじゃないの、というプロジェクトが立ち上がってから、もう一ヶ月近く経っている訳ですが、今回は「猥褻風俗史」(宮武外骨, 1911)という本をスキャンしてみました。

まずは原本を入手。2,000円しませんでしたが、明治四十四年発行のオリジナルをゲット。

これが猥褻風俗史の原本です
これが猥褻風俗史の原本です

そしてこれをスキャンする前に、思い切って中身をばらします。和装の本でしたので、糸を切ってやればバラバラ……。

ページごとにバラバラにします。結構状態は悪いですな
ページごとにバラバラにします。結構状態は悪いですな

家には実用的なフラットベッドスキャナが無いので、ここはいつも通りScansnapに頑張ってもらう訳です。まぁ、普通なら止めますわな。

A3キャリアシートよ、今こそ君の出番だ!
A3キャリアシートよ、今こそ君の出番だ!

普段余り出番のないA3キャリアシートをここぞとばかりに使ってみました。原本は何といっても和紙ですからね。そのままではScansnapに通すことができません。これは実験するまでもありませんでした。

順調にScansnapに読み込まれていく猥褻風俗史
順調にScansnapに読み込まれていく猥褻風俗史

そしてこれが読み取られた原稿。なかなか奇麗です。今回はカラーモードで、一切何も加工しない方針で読み取りました。

これが実際に読まれた結果です
これが実際に読まれた結果です

結構原本の状態がよろしくなくて、これからこれを加工して読みやすくしていくのです。たぶん。

引用文献

宮武外骨 (1911) 猥褻風俗史, 大阪, 雅俗文庫