第八节 最优二叉树(哈夫曼树)
一、概念
    在具有n个带权叶结点的二叉树中,使所有叶结点的带权路径长度之和(即二叉树的带权路径长度)为最小的二叉树,称为最优二叉树(又称最优搜索树或哈夫曼树),即最优二叉树使
Wkk个叶结点的权值;Pkk个叶结点的带权路径长度)达到最小。
二、最优二叉树的构造方法
   假定给出n个结点ki(i=1n),其权值分别为Wi(i=1n)。要构造以此n个结点为叶结点的最优二叉树,其构造方法如下: 
    首先,将给定的n个结点构成n棵二叉树的集合F={T1T2……Tn}。其中每棵二叉树Ti中只有一个权值为wi的根结点ki,其左、右子树均为空。然后做以下两步 
    F中选取根结点权值最小的两棵二叉树作为左右子树,构造一棵新的二叉树,并且置新
的二叉树的根结点的权值为其左、右子树根结点的权值之和;
    F中删除这两棵二叉树,同时将新得到的二叉树加入F 重复,直到在F中只含有一棵二叉树为止。这棵二叉树便是最优二叉树。
三、最优二叉树的数据类型定义
    在最优二叉树中非叶结点的度均为2,为满二叉树,因此采用顺序存储结构为宜。如果带权叶结点数为n个,则最优二叉树的结点数为2n-1个。
    Const n=叶结点数的上限;
          m=2*n-1{最优二叉树的结点数}
    Type 
        node=record{结点类型}
          data<数据类型>{权值}
          prtlchrch,lth0m{父指针、左、右指针和路径长度}
        end
        wtype=array[1n] of <数据类型> {n个叶结点权值的类型}
        treetype=array[1m] of node{最优二叉树的数组类型}
    Var treetreetype
                {其中tree [1n]为叶结点,tree [n+12n-1]为中间结点,根为tree [2n-1]}
四、构造最优二叉树的算法
procedure hufm(wwtypevar treetreetypevar btinteger)
  function min (hinteger)integer{在前h个结点中选择父指针为0且权值最小的结点min}    begin
      ml:=∞;
      for p:=1 to h do 
        if (tree[p]prt=0)and(m1>tree[p]data)
            then begin i:=pm1:=tree[p]data end
      min:=i
    end{min} 
  begin
    fillchar (treesizeof(tree)0){构造初始集合F}
    for i:=1 to n do
      read(tree[i]Data)
    for k:=n+1 to m do {构造最优二叉树}
      begin {计算k为根的左儿子和右儿子}
        i:=min(k-1)
        tree[i]prt:=k
        tree[k]lch:=i
        j:=min(k-1)
        tree[j]prt:=k
        tree[k]rch:=j
        tree[k]data:=tree[i]data+tree[j]data
      end{for}
    bt:=m
  end{hufm}
{计算每一个叶结点的路径长度}
procedure ht(t:integer);{通过前序遍历计算每一个叶结点的路径长度}二叉树定义
  begin
    if t=m{若结点t为根,则路径长度为0;否则结点t的路径长度为其父结点的路径长度+1}
      then tree[t].lth:=0
      else tree[t].lth:=tree[tree[t].prt].lth+1
    if tree[t].lch<>0 
      then begin ht(tree[t].lch)ht(tree[t].rch)end{then}{分别递归左右子树}
  end{ht}
 
由此可见,叶结点t1t5)的带权路径长度即为tree[t].lth*tree[t].data

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。