南开大学2021年9月《大数据开发技术》作业考核试题及答案参考
1.Mllib中线性会馆算法中的参数reParam表示( )
A.要运行的迭代次数
B.梯度下降的步长
C.是否给数据加干扰特征或者偏差特征
D.Lasso和ridge的正规化参数
参考答案:D
2.Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。( )
T.对F.错参考答案:F
3.Spark创建DataFrame对象方式有( )
A.结构化数据文件
B.外部数据库
C.RDD
D.Hive中的表
参考答案:ABCD
4.以下哪个不是Scala的数据类型( )
A.Int
B.Short Int
C.Long
D.Any
参考答案:B
5.Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记。( )
A.正确
B.错误
参考答案:A
6.关于Map端Shuffle过程中的合并与归并,说法正确的是( )。
A.两个键值对和,如果合并,会得到
B.合并不会改变最 ...


雷达卡


京公网安备 11010802022788号







