南开大学2021年9月《大数据开发技术》作业考核试题及答案参考
1.如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是( )
A.[0,numPartitions]
B.[0,numPartitions-1]
C.[1,numPartitions-1]
D.[1,numPartitions]
参考答案:B
2.MapReduce设计的一个理念就是( ),因为移动数据需要大量的网络传输开销。
A.数据向计算靠拢
B.计算向数据靠拢
C.计算向网络靠拢
D.计算与数据并行
参考答案:B
3.Scala函数组合器中flatmap结合了map和flatten的功能,接收一个可以处理嵌套列表的函数,然后把返回结果连接起来。( )
A.正确
B.错误
参考答案:A
4.Spark中DataFrame的( )方法是进行分组查询
A.order by
B.group by
C.select by
D.sort by
参考答案:B
5.实现大整数的乘法是利用( )的算法。
A.贪心法
B.动态规划法
C.分治策略
D.回溯法
参考答案:C
6.Scala中数组的第一个元素 ...


雷达卡


京公网安备 11010802022788号







