南开大学2021年9月《大数据开发技术》作业考核试题及答案参考
1.HBase的客户端并不依赖Master,而是通过( )来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小
A.Master
B.Region
C.Zookeeper
D.Chubby
参考答案:C
2.Spark的RDD持久化操作有( )方式
A.cache
B.presist
C.storage
D.long
参考答案:AB
3.NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。( )
A.对B.错参考答案:A
4.下面是贪心算法的基本要素的是( )。
A.重叠子问题
B.构造最优解
C.贪心选择性质
D.定义最优解
参考答案:C
5.Spark中DataFrame的( )方法是进行分组查询
A.order by
B.group by
C.select by
D.sort by
参考答案:B
6.RDD是一个可读写的数据结构。( )
T.对F.错参考答案:F
7.Spark Streming中( )函数可以对源DStream的每个元素通过函数fun ...


雷达卡


京公网安备 11010802022788号







