正月休みを利用して、青空文庫のファイルをOpenDocument(OpenOffice.org 2.0とかで使われているドキュメントフォーマット)に変換するスクリプトを書いてみました。
まだイマイチなところもありますが置いておきます。odt.py
zipの状態でも食わせることができます。
# python odt.py 789_ruby_5639.zip saruno_koshikake.txt 789_ruby_5639.zip -> wagahaiwa_nekodearu.odt 吾輩は猫である 夏目漱石 saruno_koshikake.txt -> saruno_koshikake.odt さるのこしかけ 宮沢賢治
もともとはOpenDocumentのフォーマットを調べてみるのが目的でした。縦書きにしようと思いましたが普通にやると(OOoのバグだと思いますが、)ルビがずれるので…直す方法はあるらしいですが、横書きのままで。
なんかいいね。こういう機動力のあるプログラミング。僕は最近は.NETを遊びで使ってるよ。たまにはMS方面も見てみたらどうだい。僕もそろそろrubyあたりに手をつけてみるから…。昔君に言われてRSSを吐くコードを書いたのを思い出したけど、xmlは吐くより食べるほうが面白いんじゃない。
うちは自宅にWindows環境がないからあんまりMS方面を遊びに使うって感じじゃないんだよなぁ。ここのところPythonに安住しすぎているので別方面に行きたい気持ちもあるけど。
最近仕事でVBからExcelいじって帳票作るプログラムばっかり作ってるよ。なんか聞いた話だとPythonだかRubyだかからExcelいじるモジュールみたいなのがあるらしいんだけど、やっぱりWindows環境限定なんだろうね。OpenOfficeにはそういうのないの?あったからって別にどういうわけじゃないんだけど。
PythonでExcelいじるってのは、たぶんファイル操作じゃなくてCOMとかでExcel自体を操作するやつだよね。OOoは…あるのかなぁ。Javaとは親和性が高そうな印象だけどな。—–