数据分析与可视化

放肆的年华 提交于 2019-12-10 03:31:36

 

 

泉州信息工程学院

软件学院

课程设计报告书

 

                                课 :  Python           

                                                          课程设计项目名称:  数据分析与可视化                     

                                团队成员:   吴清岚  吴梦云                            

 

 

 

 

一、项目简介

本项目采用NumpyPandasMatplotlib等数据库,调用bar()方法对课程成绩表进行每个班级的总体平均成绩来绘制柱状图,调用plot()方法对大学学术排名表其中五个大学进行折线图的绘制,调用pie()方法对课程成绩表绘制饼图,运用for语句实现循环体对大学学术排名表中的美国籍2018年的大学进行排序,粗略的完成对课程成绩和大学学术排名的部分数据分析与可视化,让人们对161718级网络班级课程成绩和世界大学学术排名有更加直观、深入的理解。在数据处理的过程中,使用图表、图形将数据的趋势差别相关性等关系展示出来,有助于人们对数据的理解与分析,特别对于一些高维度、高复杂度的数据,创建可视化图表对分析过程非常有益。此外,在展示数据结论时,清晰准确的图表或图形将是一种非常恰当的表达手段,“好的图表胜于千万的文字描述”。

1.1 项目博客地址

https://www.cnblogs.com/wql4024/

1.2 项目完成的功能与特色

功能:

导入NumpyPandasMatplotlib数据库,调用bar()方法、调plot()方法、调用pie()方法、运用for语句实现循环体实现柱状图、折线图、饼图以及对表格中进行排序

特色:

运用bar()方法、plot()方法、pie()方法、for语句实现循环体

   1.3 项目采用的技术栈

1、Python语言:Python是一种计算机程序设计语言。是一种面向对象的动态类型语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的、大型项目的开发

2NumPyNumPyPython的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,是矩阵计算与其它大多数框架的数据处理基础

3Matplotlib:专业画图工具Matplotlib 是一个Python 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,折线图,散点图等。

4Pandas:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

   1.4 项目借鉴源代码的地址

https://github.com/David-Github_Project/Python-Curriculum-Resources

https://blog.csdn.net/sunflower_sunuo/article/details/80572296

 

 

 

1.5 团队成员任务分配表

姓名

吴清岚

吴梦云

任务分配

大学学术排名表(折线图)

课程成绩表(饼图)

大学学术排名表(美国学校排名)

课程成绩表(柱状图)

 

二、项目的需求分析

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是量管理体的支持过程。在本次项目中我们通过对网络201611网络201612、网络201613、网络201711、网络201712、网络201813、网络201814这些班级学生的学习成绩进行数据分析,对这些学生有整体的直观的了解;通过对大学学术进行排名,发现大学这些年的排名是否产生变化,变化的程度如何,是否一直进步等,可帮助人们作出判断,以便采取适当行动

 

 

2.1项目功能架构图、主要功能流程图

 2.1.1项目功能架构图:

 

 

 

 

 

2.1.2 主要功能流程图:

 

 

三、系统模块说明

 

3.1 系统模块列表:

课程成绩表:总体平均成绩(柱状图)、课程成绩分布(饼图)

大学学术排名表:排名变化(折线图)、2017年美国大学排名

 

3.2 各模块详细描述(名称,功能,运行截图,关键源代码)

3.2.1、名称:总体平均成绩(柱状图)

功能:实现161718各个班级总体平均成绩

运行截图:

 

关键源代码:

 

 

 

3.2.2、名称:课程成绩分布(饼图)

功能:161718级网络班级成绩分布

运行截图:

 

 

关键源代码:

 

 

 

 

3.2.3、名称:大学学术排名表(折线图)

功能:南开大学、纽约大学、悉尼大学、洛桑大学、东京工业大学20162018年大学学术排名的变化

运行截图:

 

关键源代码:

 

 

 

3.2.4、名称:大学学术排名表(2017年美国学校排名)

功能:实现2017年美国所有上榜的大学按顺序排名

运行截图:

 

关键源代码:

 

四、项目总结

经过几个星期的学习和奋斗,我们成功完成了对课程成绩表和大学学术排名表的部分数据分析与可视化,用Python语言编写代码,用bar()等方法绘制图形。对Python语言的应用更加成熟,对数据分析和可视化有了进一步理解,对库的使用也有了新的想法,学到了新的知识,将Python的理论与实践结合起来运用,收获颇多。在此过程中,我们也遇到了很多困难,代码一直出错,中文乱码,错误的原因找不到等一系列问题,但通过请教同学和依靠强大的百度搜索,终于成功解决问题,在数据分析与可视化的道路上又前进了一小步。虚心向别人请教会获得很多自己不知道的知识,团队合作也让我们认识到了团队的重要性,自己的职责。正所谓,“众人拾柴火焰高”,团结才能获得成功,合作才能共赢。

 

5.1 特点

导入NumPyPandasMatplotlib等数据库,运用bar()方法、plot()方法、pie()方法、for语句实现循环体成功绘制了柱状图、折线图、饼图以及排序

5.2 不足之处

技术含量低,容易被模仿;数据分析得不够具体,还有很多图没有绘制。阅历少、经验浅,考虑不够周全,缺乏应变能力,专业知识不够丰富。

 

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!