情報理論ハンズオンセンター

情報理論の基礎(情報量・エントロピー・符号化など)を視覚的・体験的に学ぶ

ハフマン符号

ハフマン符号は、データ圧縮に使われる代表的な可変長符号化方式の一つです。文字(記号)の出現頻度が高いものには短い符号語を、低いものには長い符号語を割り当てることで、全体のデータ量を削減します。 ここでは入力されたテキストから文字の出現頻度を分析し、それに基づいてハフマン木を段階的に構築する過程を体験します。最終的に生成されたハフマン符号を用いて、元のテキストがどのように符号化され、どの程度の圧縮が行われるのか確認しましょう。

1. テキスト入力

2. 文字出現頻度

文字 頻度 確率

3. ハフマン木の段階的構築

まず文字頻度を分析してください。

符号化結果

結果はここに表示されます。