青空文庫2odt

正月休みを利用して、青空文庫のファイルをOpenDocument(OpenOffice.org 2.0とかで使われているドキュメントフォーマット)に変換するスクリプトを書いてみました。

まだイマイチなところもありますが置いておきます。odt.py

zipの状態でも食わせることができます。

# python odt.py 789_ruby_5639.zip saruno_koshikake.txt
789_ruby_5639.zip -> wagahaiwa_nekodearu.odt
吾輩は猫である 夏目漱石
saruno_koshikake.txt -> saruno_koshikake.odt
さるのこしかけ 宮沢賢治

もともとはOpenDocumentのフォーマットを調べてみるのが目的でした。縦書きにしようと思いましたが普通にやると(OOoのバグだと思いますが、)ルビがずれるので…直す方法はあるらしいですが、横書きのままで。

コメントはありません

  1. なんかいいね。こういう機動力のあるプログラミング。僕は最近は.NETを遊びで使ってるよ。たまにはMS方面も見てみたらどうだい。僕もそろそろrubyあたりに手をつけてみるから…。昔君に言われてRSSを吐くコードを書いたのを思い出したけど、xmlは吐くより食べるほうが面白いんじゃない。

  2. うちは自宅にWindows環境がないからあんまりMS方面を遊びに使うって感じじゃないんだよなぁ。ここのところPythonに安住しすぎているので別方面に行きたい気持ちもあるけど。

  3. 最近仕事でVBからExcelいじって帳票作るプログラムばっかり作ってるよ。なんか聞いた話だとPythonだかRubyだかからExcelいじるモジュールみたいなのがあるらしいんだけど、やっぱりWindows環境限定なんだろうね。OpenOfficeにはそういうのないの?あったからって別にどういうわけじゃないんだけど。

  4. PythonでExcelいじるってのは、たぶんファイル操作じゃなくてCOMとかでExcel自体を操作するやつだよね。OOoは…あるのかなぁ。Javaとは親和性が高そうな印象だけどな。—–

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です