Eng 第94页
单选题:发现关联规则的算法通常要经过以下三个步骤:连接数据, 作数据准备;给定最小支持度和( ),利用数据挖掘工具提供的算法发现关
发现关联规则的算法通常要经过以下三个步骤:连接数据, 作数据准备;给定最小支持度和( ),利用数据挖掘工具提供的算法发现关联规则;可视化显示、理解、评估关联规则。A.最小兴趣度B.最小置信度C.最大支持度D.最小可信度answer:D…
单选题:大数据方法的不准确性,根本原因是( )。
大数据方法的不准确性,根本原因是( )。A.数据量大B.算法变化C.信息遗漏D.以上都正确answer:D…
单选题:以下不属于数据可视化图形的是( )。
以下不属于数据可视化图形的是( )。A.南丁格尔的玫瑰图B.约翰斯诺的标点地图C.百度迁徙图D.普通的世界地图answer:D…
单选题:对于一组数据(1,2,2,NAN,4),若采用众数法补全缺省值,则NAN该补为( )。
对于一组数据(1,2,2,NAN,4),若采用众数法补全缺省值,则NAN该补为( )。A.1B.1.8C.4D.2answer:D…
单选题:数据仓库所存储的数据,通常具有一定特点,下列哪些不属于其特点的( )。
数据仓库所存储的数据,通常具有一定特点,下列哪些不属于其特点的( )。A.面向特定主题B.数据大都反应历史C.数据来源多样D.经常修改数据项的值answer:D…
单选题:数据仓库的最终目的是( )
数据仓库的最终目的是( )A.收集业务需求B.建立数据仓库逻辑模型C.开发数据的应用分析D.为用户和业务部门提供决策支持answer:D…
单选题:如下哪个不是最近邻分类器的特点( )。
如下哪个不是最近邻分类器的特点( )。A.它使用具体的训练实例进行预测,不必维护源自数据的模型B.分类一个测试样例开销很大C.最近邻分类器基于全局信息进行预测D.可以生产任意形状的决策边界answer:C…
单选题:在Bigtable中,( )主要用来存储子表数据以及一些日志文件。
20. 在Bigtable中,( )主要用来存储子表数据以及一些日志文件。A.GFSB.MapreduceC.SstableD.Chubbyanswer:A…
单选题:下列哪项通常是集群的最主要瓶颈( )。
下列哪项通常是集群的最主要瓶颈( )。A.内存B.CPUC.网络D.磁盘I/Oanswer:D…