西安电子科技大学数据挖掘课程课件,关于分类聚部分的
这个和达到或者超过了某个阈值,输出一个量。如有输入值X1, X2, ..., Xn 和它们的权系数:W1, W2, ..., Wn,求和计算出的 Xi*Wi ,产生了激发层 a = (X1 * W1)+(X2 * W2)+...+(Xi * Wi)+...+ (Xn * Wn),其中Xi 代表样本的不同特征,Wi是实时特征评估模型中得到的权系数。
对于单输出型,网络的每一个输入节点对应样本一个特征,而输出层节点只有一个,为每个类建立一个这样的网络,对每一类进行分别训练,将属于这一类的样本的期望输出设为1,而把属于其他类的样本的期望输出设为0;在识别阶段,将未知类别的样本输入到每一个网络,如果某个网络的输出接近1(或大于某个阈值,比如0.5 )则判断该样本属于这一类;如果有多个网络的输出均大于阈值,则或者将类别判断为具有最大输出的那一类,或者做出拒绝。
神经网络的另一个优点是很容易在并行计算机上实现,可以把他的节点分配到不同的CPU上并行计算。
在使用神经网络时有几点需要注意:第一,神经网络很难解释,目前还没有能对神经网络做出显而易见解释的方法学。
第二,神经网络会学习过度,在训练神经网络时一定要恰当的使用一些能严格衡量神经网络的方法,如前面提到的测试集方法和交叉验证法等。这主要是由于神经网络太灵活、可变参数太多,如果给足够的时间,他几乎可以“记住”任何事情。
第三,除非问题非常简单,训练一个神经网络可能需要相当可观的时间才能完成。当然,一旦神经网络建立好了,在用它做预测时运