数据分析面试题及答案
对于数据分析的面试者而言,在面试前做好面试准备,提前了解面试题及答案很重要。下面已经为你们了数据分析面试题及答案
,希望可以帮到你。
一、异常值是指什么
?请列举1种识别连续型变量异常值的方法
?异常值(Outlier)
是指样本中的个别值,其数值明显偏离所属样本的其余观测值。在数理统计里一般是指一组观测值中与平均值的偏差超过两倍标准差的测定值。
Grubbs
’test(
是以FrankE.Grubbs
命名的),又叫maximumnormedresidualtest
,是一种用于单变量数据集异常值识别的统计检测,它假定数据集正态分布的总体。总体标准差σ,在五种检验法中,优劣次序为:
t检验法、格拉布斯检验法、峰度检验法、狄克逊检验法、偏度检验法。
二、什么是聚类分析
?聚类算法有哪几种
?请选择一种详细描述其计算原理和步骤。聚类分析
(clusteranalysis)
是一组将研究对象分为相对同质的群组
(clusters)
的统计分析技术。聚类分析也叫分
类分析(classificationanalysis)
或数值分类
(numericaltaxonomy ...


雷达卡


京公网安备 11010802022788号







