単にそのままzipに入れればいいんじゃん

昨日のMHTMLの話の続きで、要するにページを保存するときに、関連する複数のファイルを保存したい&URLをメタデータとして持っておきたいということだと思った。 これだけだったらzipやtarでファイル名が入る領域にURL …

Continue reading ‘単にそのままzipに入れればいいんじゃん’ »

MHTML(*.mhtファイル)をLinuxで使う方法

こんなものはいかがか? WindowsのIEではMHTMLという形式で、Webページ全体を保存することができる。MHTMLはメールの添付ファイルの形式をアーカイブ形式として使っている。なぜこのような形式を採用したのか理解 …

Continue reading ‘MHTML(*.mhtファイル)をLinuxで使う方法’ »

MozillaのブックマークをOPMLに変換する、あるいはOPMLのツリー構造の特定のパスを取り出す

恥ずかしげもなく、bm2opml.py、opmlsplit.pyをとりあえずさらしておきます。 それぞれ、Mozilla(firefoxでしか試していない)のブックマークをOPMLに変換する、含まれる情報がかなり落ちる上 …

Continue reading ‘MozillaのブックマークをOPMLに変換する、あるいはOPMLのツリー構造の特定のパスを取り出す’ »