Apache Axis

Python pandas教程推荐

我的梦境 提交于 2020-07-29 07:50:08
简介 下面内容为github作者的Pandas学习笔记,目前是我看到最好的资料,没有之一。搬砖: https://github.com/datawhalechina/joyful-pandas/blob/master/README.md ​ github.com Joyful-Pandas 【本教程与Pandas官方最新发行版本保持同步,当前版本: v-1.0.3 】 【注意】使用教程前请务必将Pandas升级到最新版本,否则可能会有代码运行报错 一、写作初衷 在使用Pandas之前,几乎所有的大型表格处理问题都是用xlrd/xlwt和python循环实现,虽然这已经几乎能完成一切的需求,但其缺点也显而易见,其一就是速度问题,其二就是代码的复用性几乎为0。 曾经也尝试过去零星地学Pandas,但不得不说这个包实在太过庞大,每次使用总觉得盲人摸象,每个函数的参数也很多,学习的路线并不是十分平缓。如果你刚刚上手使用Pandas,那么在碎片的学习过程中,报错是常常发生的事,并且很难修(因为不理解内部的操作),即使修好了下次又不会,令人有些沮丧。 2019秋季,我偶然找到了一本完全关于Pandas的书,Theodore Petrou所著的Pandas Cookbook,现在可在网上下到pdf,不过现在还没有中文版。寒假开始后,立即快速地过了一遍,发现之前很多搞不清的概念得到了较好的解答

Python:numpy库中的一些函数简介、使用方法之详细攻略

僤鯓⒐⒋嵵緔 提交于 2020-07-29 06:53:36
Python:numpy库中的一些函数简介、使用方法之详细攻略 目录 numpy库中的一些函数简介、使用方法 1、np.concatenate() 1.1、函数案例 1.2、函数用法 numpy库中的一些函数简介、使用方法 1、np.concatenate() 1.1、函数案例 import numpy as np a=np.array([1,2,3]) b=np.array([11,22,33]) c=np.array([44,55,66]) d=np.concatenate((a,b,c),axis=0) # 默认情况下,axis=0可以不写 print(d) #输出array([ 1, 2, 3, 11, 22, 33, 44, 55, 66]),对于一维数组拼接,axis的值不影响最后的结果 1.2、函数用法 concatenate Found at: numpy.core.multiarray concatenate((a1, a2, ...), axis=0, out=None) Join a sequence of arrays along an existing axis. Parameters ---------- a1, a2, ... : sequence of array_like. The arrays must have the same shape,

Excel VBA Chart 刻度 Axis.DisplayUnit

血红的双手。 提交于 2020-07-29 05:00:39
With Sheets ( "Report" ). ChartObjects . Add (...) . Chart . Axes ( xlCategory ). MinimumScale = RoundTo50 ( Sheets ( sheetName ). Range ( "M4" )) . Chart . Axes ( xlCategory ). MaximumScale = RoundTo50 ( Sheets ( sheetName ). Range ( "M124" )) . Chart . Axes ( xlCategory ). MajorUnit = RoundTo50 ((. Chart . Axes ( xlCategory ). MaximumScale - . Chart . Axes ( xlCategory ). MinimumScale ) / 12 ) . Chart . Axes ( xlCategory ). MinorUnit = . Chart . Axes ( xlCategory ). MajorUnit / 3 With Charts("Chart1").Axes(xlValue) . DisplayUnit = xlHundreds .HasTitle = True .AxisTitle.Caption = "Rebate

Python 数据分析三剑客之 Matplotlib(九):极区图 / 极坐标图 / 雷达图的绘制

本秂侑毒 提交于 2020-07-28 17:09:33
小黄人番外短片合集 — 第15集【Mower Minions 修剪草坪的小黄人】 Matplotlib 系列文章(持续更新中): 《Python 数据分析三剑客之 Matplotlib(一):初识 Matplotlib 与其 matplotibrc 配置文件》 《Python 数据分析三剑客之 Matplotlib(二):文本描述 / 中文支持 / 画布 / 网格等基本图像属性》 《Python 数据分析三剑客之 Matplotlib(三):图例 / LaTeX / 刻度 / 子图 / 补丁等基本图像属性》 《Python 数据分析三剑客之 Matplotlib(四):线性图的绘制》 《Python 数据分析三剑客之 Matplotlib(五):散点图的绘制》 《Python 数据分析三剑客之 Matplotlib(六):直方图 / 柱状图 / 条形图的绘制》 《Python 数据分析三剑客之 Matplotlib(七):饼状图的绘制》 《Python 数据分析三剑客之 Matplotlib(八):等高线 / 等值线图的绘制》 《Python 数据分析三剑客之 Matplotlib(九):极区图 / 极坐标图 / 雷达图的绘制》 文章目录 【1x00】了解极坐标 【2x00】基本方法 matplotlib.pyplot.polar() 【3x00】绘制极坐标 【4x00】绘制雷达图

d3js scales深入理解

自闭症网瘾萝莉.ら 提交于 2020-07-28 10:55:37
https://www.cnblogs.com/kidsitcn/p/7182274.html d3js scales深入理解 比例尺函数是这样的javascript函数: 接收通常是数字,日期,类别等data输入并且: 返回一个代表可视化元素的值,比如坐标,颜色,长度或者半径等 比例尺通常用于变换(或者说映射)抽象的数据值到可视量化变量(比如位置,长度,颜色等) 比如,假设我们有以下数组数据: [ 0, 2, 3, 5, 7.5, 9, 10 ] 我们可以这样创建一个比例尺函数: var myScale = d3.scaleLinear() .domain([0, 10]) .range([0, 600]); d3将创建一个myScale函数用于接收[0,10]之间的数据输入(domain)映射为[0,600]像素的位置数据(range) 我们可以使用myScale函数来计算对应数据的positions数据: myScale(0); // returns 0 myScale(2); // returns 120 myScale(3); // returns 180 ... myScale(10); // returns 如上面所说,比例尺主要用于将抽象数据映射为可视的量化元素,比如位置,长度,半径,颜色等。比如,他们可以这样应用 将抽象数据映射为0到500的长度值以便在bar

【实验】基于随机森林的气温预测

喜你入骨 提交于 2020-07-28 03:01:02
一、天气最高温度预测任务 实验数据以及源代码 https://github.com/wyn-365/temp-predict.git 1.1 任务 我们要完成三项任务: 使用随机森林算法完成基本建模任务 基本任务需要我们处理数据,观察特征,完成建模并进行可视化展示分析 观察数据量与特征个数对结果影响 在保证算法一致的前提下,加大数据个数,观察结果变换。重新考虑特征工程,引入新特征后观察结果走势。 对随机森林算法进行调参,找到最合适的参数 掌握机器学习中两种经典调参方法,对当前模型进行调节 # 数据读取 import pandas as pd features = pd.read_csv('data/temps.csv') features.head(5) 数据表中 year,moth,day,week分别表示的具体的时间 temp_2:前天的最高温度值 temp_1:昨天的最高温度值 average:在历史中,每年这一天的平均最高温度值 actual:这就是我们的标签值了,当天的真实最高温度 friend:这一列可能是凑热闹的,你的朋友猜测的可能值,咱们不管它就好了 1.2 数据大小 print('The shape of our features is:', features.shape) # 统计指标 features.describe() # 对于时间数据

Python中 Matplotlib局部放大图的画法

心已入冬 提交于 2020-07-27 13:03:28
在做对比实验中,除了对整体形状的对比,在很多情况下都需要对某一局部的数据进行放大,来观察更加精细的对比效果。 工具 Python的Matplotlib库函数 步骤 1、导入依赖库 import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.axes_grid1.inset_locator import inset_axes from matplotlib.patches import ConnectionPatch 2、准备数据 reward_demaddpg[] 储存的是执行demaddpg算法后所获得的300个reward结果。 因此横坐标设置为: MAX_EPISODES = 300 x_axis_data = [] for l in range(MAX_EPISODES): x_axis_data.append(l) 5个对比实验结果存在5个数组中,分别表示demaddpg算法中设置的不同的学习率: 3、绘主图 fig, ax = plt.subplots(1, 1) ax.plot(x_axis_data, reward_demaddpg5, color='#4169E1', alpha=0.8, label='$1*10^{-5}$') ax.plot(x_axis_data, reward

Python图像处理

守給你的承諾、 提交于 2020-07-25 18:31:44
作者|Garima Singh 编译|VK 来源|Git Connected 以前照相从来没有那么容易。现在你只需要一部手机。拍照是免费的,如果我们不考虑手机的费用的话。就在上一代人之前,业余艺术家和真正的艺术家如果拍照非常昂贵,并且每张照片的成本也不是免费的。 我们拍照是为了及时保存伟大的时刻,被保存的记忆随时准备在未来被"打开"。 就像腌制东西一样,我们要注意正确的防腐剂。当然,手机也为我们提供了一系列的图像处理软件,但是一旦我们需要处理大量的照片,我们就需要其他的工具。这时,编程和Python就派上用场了。Python及其模块如Numpy、Scipy、Matplotlib和其他特殊模块提供了各种各样的函数,能够处理大量图片。 为了向你提供必要的知识,本章的Python教程将处理基本的图像处理和操作。为此,我们使用模块NumPy、Matplotlib和SciPy。 我们从scipy包misc开始。 # 以下行仅在Python notebook中需要: %matplotlib inline from scipy import misc ascent = misc.ascent() import matplotlib.pyplot as plt plt.gray() plt.imshow(ascent) plt.show() 除了图像之外,我们还可以看到带有刻度的轴

利用Python快速进行数据探查

孤者浪人 提交于 2020-07-24 05:56:53
工作中你是否遇见这样的问题: 接手新业务时需要了解数十上百张的数据库表结构; 表中的数据量级均是百万级以上; 希望可以批量快速生成如下表格。 数据探查结果表 如果你遇到了以上的问题,恭喜你,本文可以帮助你解决! 1、解决思路 但有人会有疑问,Python进行数据探查不是非常简单的事吗,一个函数分分钟搞定,还有必要专门介绍吗。如果你这样想就too yong too simple了。 你可以回想下,当我们采用descirbe()函数时,默认的前提是已经将数据读入了Python之中。但你可曾想过,实际工作中数据读入也会成为一种问题。对的,当数据量级一旦达到百万以上甚至更多时,Python读取数据的效率就很低了。读取一张表可能就要半小时以上,几十张表的话差不多就得一天了。这样低效的方法,肯定是不可取的。 本文就是来源于工作中的实际需求,在上述的方式行不通时,我转变思路寻找了另一种方式。具体的逻辑思路如下: 也就是说,为了快速进行探查,我们可以不用进行全表读入,只需对每个表每个字段进行分组查询就可以了。但如何将SQL查询语句进行循环呢?采用字符串的格式化输出! 2、代码实现 首先我们导入相关包 import pymysql import pandas as pd import datetime as dt start=dt.datetime.now() #为了计算程序执行时间

使用openpyxl生成包含echarts柱形图的Excel文件

五迷三道 提交于 2020-05-08 16:52:01
使用openpyxl生成包含echarts柱形图的Excel文件 效果图如下: 代码如下: from openpyxl import Workbook from openpyxl.chart import BarChart, Series, Reference wb = Workbook(write_only=True) ws = wb.create_sheet() rows = [ ('时间', '男', '女'), (2015, 70414, 67048), (2016, 70815, 67456), (2017, 71137, 67871), (2018, 71351, 68187), (2019, 71527, 68478) ] for row in rows: ws.append(row) chart1 = BarChart() chart1.type = "col" chart1.style = 1 chart1.title = "柱形图" chart1.y_axis.title = '数量(万人)' chart1.x_axis.title = '时间' data = Reference(ws, min_col=2, min_row=1, max_row=6, max_col=3) cats = Reference(ws, min_col=1, min_row=2,