全国大学生数据分析知识竞赛正如火如荼的进行中 参与答题,满60分即可获得相应的电子证书,一等奖、二等奖、三等奖。以下是小编整理的2022年全国大学生数据分析科普知识竞赛题库及答案,供大家参考借鉴,希望可以帮助到有需要的朋友,欢迎阅读与收藏。
2022年全国大学生数据分析科普知识竞赛题库及答案
一、单选题(每题1分)
1、小米摄像头记录下来的10分钟视频属于哪类数据:
a、结构化数据
b、半结构化数据
c、非结构化数据
2、结构化数据具备哪种特征:
a、具备明确逻辑关系
b、不具备明确逻辑关系
c、不一定具备明确逻辑关系
3、指纹打卡的数据属于哪些数据:
a、传感数据
b、交互数据
c、交易数据
4、大数据擅长处理哪个级别的数据?
a、mb
b、gb
c、tb
d、pb
5、电子邮件是什么类型数据:
a、非结构化数据
b、结构化数据
c、半结构化数据
6、网络新闻是什么类型数据:
a、非结构化数据
b、结构化数据
c、半结构化数据
7、下列属于结构化数据的是:
a、图片
b、一卡通学生信息
c、简历
8、表1属于几维列表?
表1
a、二维
b、三维
c、四维
d、五维
9、图1中的警衔级别属于哪种属性?
图1
a、标称属性
b、二元属性
c、序数属性
d、数值属性
10、关系型数据库中所谓的“关系”是指什么
a、数据库中的数据彼此间存在任意关联
b、数据模型满足一定条件的二维表格式
c、两个数据库之间有一定的关联
11、下列哪种数据类型不适合mysql存储:
a、excel报表
b、图片和声音
c、数据库里的财务数据
12、以下不属于acid原则的是:
a、原子性
b、相对性
c、隔离性
d、持久性
13、淘宝自主设计的自动化分布式存储系统是:
a、mongodb
b、hbase
c、oceanbase
14、beansdb 是一个由我国哪个公司网站自主开发的:
a、淘宝
b、豆瓣社区
c、优酷
d、视觉中国
15、下列不是newsql数据库的是:
a、sybase
b、memsql
c、tokudb
16、下列不是nosql数据库的是:
a、bigtable
b、dynamo
c、db2
17、下列不是传统关系型数据库的是:
a、mysql
b、hbase
c、sybase
18、下面关于数据挖掘的说法哪些是错误的:
a、数据挖掘涉及数据融合、数据分析和决策分析和决策支持等内容
b、数据源必须是真实的、大量的、含有噪声的和用户感兴趣的数据
c、所有发现的知识都是绝对的
19、下列不属于数据挖掘知识的方法
a、数学方法
b、归纳方法
c、实验方法
20、一般情况下,舆情监测内容不包含:
a、对主流门户网站、国内外主流论坛、主流媒体、主流搜索引擎等站点进行全景扫描
b、对单位相关刑事、民事、行政案件与信息进行全面收集、精确分析、清晰归类和个性统计
c、对个人或家成员庭银行帐户及个人财产情况进行全面收集、分析和统计
21、科学可视化、信息可视化和可视分析三者之间如何区分:
a、三者从属关系
b、三者属于递进关系
c、三者之间没有清晰边界
22、下列哪个不属于可视化的作用:
a、信息传播与协调
b、支持对信息的推理和分析
c、对信息进行筛选和储存
23、下图为百度地图显示某地区的加油站,此图为哪类可视化:
a、层次与网络可视化
b、时空数据可视化
c、多变量数据可视化
24、下图为伦敦地铁图,此图为哪类可视化:
a、层次与网络可视化
b、时空数据可视化
c、多变量数据可视化
25、下图为大数据标签云,此图为哪类可视化:
a、多变量数据可视化
b、时空数据可视化
c、非结构化数据可视化
26、目前在全球云计算市场份额占有率最高的公司是:
a、谷歌
b、亚马逊
c、微软
d、ibm
27、在大数据背景下,电子商务的价值创造方式呈现出新的变化,下列说法错误的是:
a、电子商务营销精准化和实时化
b、产品和服务高度差异化和个性化
c、价值链上企业运作差异化和静态化
d、新型增值服务模式不断涌现
28、下列哪个不是大数据下互联网广告的特点
a、广告内容更有针对性
b、提高广告决策效率
c、广告以平面媒体为主
d、广告传播模式的改变
29、微信朋友圈的feed流广告的推广更为准确描述是:
a、大数据会使受众与产品的距离更贴近
b、对于目标受众的划分更加精细
c、大数据最本质的应用就在于预测
d、随意投放的广告
30、啤酒与尿布的营销案例应用了零售行业的哪种方法:
a、发现关联购买行为
b、客户群体细分
c、供应链管理
二、多选题(每题2分)
1.hadoop1.0平台最核心的两个项目(组件)是:
a、hdfs
b、hive
c、hbase
d、mapreduce
2.以下平台属于apache软件基金会项目的是:
a、hadoop
b、spark
c、storm
d、mongodb
3.以下属于大数据挖掘算法的是:
a、决策树
b、支持向量机
c、极差规格化
d、朴素贝叶斯
4.以下属于spark平台特点的是:
a、共享变量
b、离线处理
c、内存计算
d、弹性分布式数据集
5.在分布式云计算平台中,分布式文件系统的块文件的大小可以是:
a、28m
b、64m
c、100m
d、128m
三、判断题(每题1分)
1.newsql是一种新兴的非关系型数据库。()
2.数据分析主要是指对过去的数据进行分析总结可视化,而数据科学主要是通过数据模型
指对将来的发展趋势进行预测。()
3.python是一种跨平台语言,可以安装在linux,macos和windows操作系统中。()
4.数据etl属于数据分析和挖掘的范畴。()
5.mapreduce的输入是基于key-value键值对。()
6.云计算提供的三种服务形式中,iaas是指客户通过internet即可使用租用商提供的软
件。()
7.hadoop主要用于离线大数据分析,而storm主要用于在线实时大数据分析。()
8.商务智能(bi)的基本体系结构包括数据仓库、联机分析处理和数据挖掘。()
9.r语言只能用作数据分析,而python语言既可以用作数据分析也可以用作数据可视化。
()
10.hdfs的主服务器名称叫做datanode。()
近500万道试题、20多万套资源、50多万篇作文、60多万篇范文免费使用
每天仅需0.22元,尊享会员权益