Skip to main content

山椒の実

Edelta: A Word-Enlarging Based Fast Delta Compression Approach

HotStorage15の論文。

delta compressionの話。以前何かやろうとしたなぁ、delta encodingなつかしー。world enlargeだと思ったらword enlargeだった。

delta encodingで共通部分を見つけるときに、一度見つけたら続きもつながっていることが多く、それを利用してスループットを上げるという話だった。あんまり難しいことを言ってるようには聞こえないが、効果は出ている。edeltaはdelta encodingを高速に処理できるのだ。

xdelta, zdelta等と比較している。bsdiffは最近使わないのかな。計算量が多くて嫌われたか? gitのバイナリ差分はxdeltaではなくlibxdiffてのを使っているとか。見ないうちにdelta encodingの世界もずいぶん趣が変わったのかも。私が以前に興味を持っていたときは、領域をある程度限定したうえでbsdiff、というのがベストだった気が。bsdiffは確かにメモリも食うし時間もかかったけど、私が当時ターゲットにしていた4KBブロック同士の処理だとあまり気にならないレベルだったなぁ。

同名のこれとは別物。論文中ではddeltaというのも引き合いに出されている。