13. Statistica中实现聚类分析的过程是:[Statistics]/[ Multivariate Exploratory Techniques]/
。
14. 数对距离进行度量。
15. 后的样本的子集越纯越好,即它们的熵越小越好。 16. C&RT算法的全称是指标指标作为选择分枝方案的依据,在选择分枝方案时,需经两步完成,第一步,在每个节点处评估所有属性的每个标准问题的 gini 指标,第二步,选择gini 指标最大的标准问题作为分枝方案。 17. 已知某数据集中某属性的不同取值为,{2.6,1, 2.9, 2,5,4.2,2.3,3 },则该属性的标准问题集
为{Is A≤1.5,Is A≤2.15,Is A≤2.45,Is A≤2.75,Is A≤2.95,Is A≤3.6,Is A≤4.6}。
18. 已知某数据集中某属性的不同取值为,{优,良,中,差},则该属性的标准问题集为。 二、单项选择题(抄题干及你认为正确的选项,图可以不画)
1. Excel中,当把F7单元格复制到G8单元格时出现了如下信息提示,关于这一现象,以下描述正确的
是( C )。
(A) G8单元格的数据应该是17,可能格式设置为小数点后5位,超过了单元格显示区域,出现此提示 (B) C8或D8单元格的数据有问题 (C) D8和E8不能相加 (D) F8为空值,无法加总得到结果
2. 在Excel中,要实现如下图所示的汇率换算,可以在D5单元格中输入(B),之后将它复制到下面的
单元格,就可以实现不同币值的换算。
(A) $C$2*C5 (B) =C$2*C5 (C) =6.912*786 (D) =C2*C5 3. 以下关于SPSS中定义变量值标签的描述中,错误的是(C)
(A) 定义值标签可简化数据录入