2024年4月5日发(作者:)
《大数据分析师(初级)》考前模拟A3卷
1.【单选题】搜狗搜索引擎的爬虫叫()。
A:百度蜘蛛
B:360Spider
C:Sogouspider
D:Bingbot
正确答案:C
2.【单选题】数据采集的()与技术执行的速度、团队内部成员协同以及数据分析需求和目标实现的效率有关。
A:全面性
B:多维性
C:无序性
D:高效性
正确答案:D
答案解析:数据采集的高效性与执行速度、协调性有关。
3.【单选题】下列数据预处理任务,( )可以用来平滑数据,消除数据噪声。
A:数据清洗
B:数据集成
C:数据变换
D:数据规约
正确答案:A
答案解析:消除噪声属于数据清洗阶段的任务
4.【单选题】下列不是用于大数据查询分析计算的产品是( )。
A:Hive
B:HBase
C:SparkSQL
D:Dremel
正确答案:B
答案解析:Hbase是分布式存储技术。
5.【单选题】数据仓库—般都是存在层次架构的,比如可以分为ODS、DW、DM层,不同粒度的表,不同作用的表,一般
会分布在不同的层级中,如下相关信息表存放在ODS层的有( )。
A:从源系统同步至数仓的粒度相同的一张登录日志表
B:日期为天粒度的登录统计表
C:从人的角度统计的登录情况表
D:日期为月粒度的登录统计表
正确答案:A
答案解析:ODS层存储的明细数据。
6.【单选题】从数据量方面来看,互联网系统和机器系统产生的数据量要()企业系统的数据量。
A:远远大于
B:远远小于
C:等于
D:无法确定
正确答案:A
7.【单选题】数据规约的目的是( )。
A:填补数据中的空缺值
B:集成多个数据源的数据
C:得到数据集的压缩表示
D:规范化数据
正确答案:C
8.【单选题】下列陈述不正确的是()。
1 / 11
A:大数据将实现科学决策
B:大数据使政府决策更加精准化
C:大数据彻底将群体性事件化解在萌芽状态
D:大数据将实现预测式决策
正确答案:C
答案解析:由于大数据是从量变到质变的过程,加之数据被广泛挖掘,决策依据的信息完整性越来越高,依据信息的理性
决策要高于以盲目决策。宏观层面中,大数据使得经济决策部门可以更加敏锐的把握经济走向,并制定实施科学的经济决
策;在微观层面中,大数据可以提高企业经营决策水平和效率,推动创新,给企业以及所处的行业领域带来价值。
9.【单选题】下列哪项不是用于数据查询( )。
A:Union
B:DELETE
C:SELECT
D:Project
正确答案:B
答案解析:数据查询包括传统的并(Union)、交(Intersection)、差(Difference)等集合运算,以及选择(Select)、投影
(Project)、连接(Join)除(Divide)等专门的关系运算。
10.【单选题】AnalyticDB的优势不包括( )。
A:更大规模和更快读写能力
B:更高可用和可靠性
C:更高安全
D:分布式计算能力
正确答案:D
答案解析:AnalyticDB有很多的优势:更大规模和更快读写能力、更高可用/可靠、更高安全和简单易用。
11.【单选题】下列属于列族数据库的是( )。
A:HBase
B:Redis
C:MySQL
D:MongoDB
正确答案:A
答案解析:列族数据库的相关产品包括:BigTable、HBase、Cassandra等。
12.【单选题】Zookeeper的主要作用是()。
A:分布式的海量日志采集、聚合和传输
B:基于Hadoop的数据仓库
C:分布式列式数据库
D:分布式协调服务
正确答案:D
13.【单选题】利用Sqoop从关系数据库导入数据到Hive时,必须指定的参数为()。
A:hive-table
B:hive-database
C:hive-import
D:fields_termiated_by
正确答案:C
答案解析:需要指定hive-import
14.【单选题】下列不属于分布式计算技术的是()。
A:MapReduce
B:Spark
C:Flink
D:TensorFlow
正确答案:D
答案解析:分布式计算技术包括MapReduce、Spark和Flink,是大数据环境下的并行计算框架,而TensorFlow是深度学习计算
框架。
15.【单选题】下列哪项不是大数据发展的技术支撑()。
2 / 11
发布者:admin,转转请注明出处:http://www.yc00.com/web/1712279859a2033890.html
评论列表(0条)