0%

46. 决策树

1. 节点

  1. 增加节点相当于在数据中切一刀
  2. 特征就相当于节点,越多的特征相当于越多的节点
  3. 根节点:可以把数据的分类分的更好(多)
  4. 次节点:类似于在其余的节点当中选择根节点,以此类推

2. 衡量标准-熵值

  1. 熵:表示随机变量不确定性的量度(说白了就是物体内部的混乱程度,比如:杂货市场里面什么都有那肯定混乱呀,专卖店里面只卖一个牌子的那就稳定多了)
  2. 公式: $H(x)=-\sum{p_i * \log{p_i}},i = 1, 2, 3, ……, n$