刘鹏

大数据基础--R语言(刘鹏《大数据》课后习题答案)

浪子不回头ぞ 提交于 2019-12-06 05:51:41
1.R语言是解释性语言还是编译性语言?    解释性语言 2.简述R语言的基本功能。    R语言是一套完整的数据处理、计算和制图软件系统,主要包括以下功能:     (1)数据存储和处理功能,丰富的数据读取与存储能力,丰富的数据处理功能。     (2)数组运算工具     (3)完整连贯的统计分析工具     (4)优秀的统计制图功能 3.R语言通常用在哪些领域?    人工智能、统计分析、应用数学、计量经济、金融分析、财经分析、生物信息学、数据可视化与数据挖掘等。 4.R语言常用的分类和预测算法有哪些?    (1)K-近邻算法,如果一个样本与特征空间中的K个最相似(特征空间最近邻)的样本中的大多数属于某一个类别,则该样本也属于这一类别。   (2)决策树,是一种依托于分类、训练上的预测树,根据已知预测、归类未来。   (3)支持向量机,是一个二分类的办法,即将数据集中的数据分为两类。 5.简述如何利用R程序包进行数据分析、建模和数据预测。    数据集加载->数据集中的数据分析->无效数据处理->预测模型的构建->模型的评价与选择->实际需求预测->完成对应用需求的实现预测 6.如何使用“聚类”和“分类”对数据样本进行分组。    “聚类”和“分类”都可以从历史数据纪录中自动推导出给定数据的推广描述,从而能对未来数据进行预测。不同的是, “分类”算法需要用训练样本构造分类器