Apache Axis

Python 泰坦尼克生存率预测(修改)

谁说胖子不能爱 提交于 2020-05-06 06:43:36
步骤: 一、提出问题 二、理解数据 1、采集数据 2、导入数据 3、查看数据信息 三、数据清洗 1、数据预处理 2、特征工程 四、构建模型 五、模型评估 六、方案实施 撰写报告 一、提出问题:什么样的人在此次事件中更易存活? 二、数据理解: 1、采集数据:从Kaggle泰坦尼克号项目页面下载数据: https://www.kaggle.com/c/titanic 本人是采用百度上来的数据集 网盘地址: https://pan.baidu.com/s/1BfRZdCz6Z1XR6aDXxiHmHA 提取码:jzb3 2、导入数据 # 导入处理数据包 import numpy as np import pandas as pd # 导入数据 # 训练数据集 train = pd.read_csv( " ./train.csv " ) # 测试数据集 test = pd.read_csv( " ./test.csv " ) # 这里要记住训练数据集有891条数据,方便后面从中拆分出测试数据集用于提交Kaggle结果 print ( ' 训练数据集: ' ,train.shape, ' 测试数据集: ' ,test.shape) 训练数据集: (891, 12) 测试数据集: (418, 11) rowNum_train= train.shape[0] rowNum_test = test

用Python来揭秘吃瓜群众是如何看待罗志祥事件的

六月ゝ 毕业季﹏ 提交于 2020-05-05 16:53:36
前言 最近娱乐圈可以说得上是热闹非凡,前有霸道总裁爱小三,正宫撕逼网红女,后有阳光大男孩罗志祥,被周扬青扒的名声扫地。贵圈的爱情故事,常人是难以理解的,正如贾旭明张康这段相声所说的这样,娱乐圈的爱情总是分分合合,成为老百姓茶余饭后的谈资,城外的人想进去,城里的人真会玩。 各种版本的洗白、谣言遍地乱飞,吃瓜网友们是如何看待的呢? 用数据说话,是数据工作者的意义所在,整个数据分析的过程分为三步: 数据获取 数据预处理 数据可视化及数据分析 以下是具体步骤和代码实现: 数据获取 数据获取地址: 'http: //ent.163.com/20/0423/09/FASTLQ7I00038FO9.html' 在爬取评论数据之前,我们需要按F12对评论数据网页进行分析,可以发现共计172页,offset从0开始,每增加一页offset增加30,可以使用get方法获取。 核心代码: headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.106 Safari/537.36'} # 评论地址 url= "http://comment.api.163.com/api/v1/products

吴裕雄 数据挖掘与分析案例实战(6)——线性回归预测模型

做~自己de王妃 提交于 2020-05-05 15:44:35
# 工作年限与收入之间的散点图 # 导入第三方模块 import pandas as pd import seaborn as sns import matplotlib.pyplot as plt # 导入数据集 income = pd.read_csv(r'F:\\python_Data_analysis_and_mining\\07\\Salary_Data.csv') print(income.shape) print(income.head()) # 绘制散点图 sns.lmplot(x = 'YearsExperience', y = 'Salary', data = income, ci = None) # 显示图形 plt.show() # 简单线性回归模型的参数求解 # 样本量 n = income.shape[0] # 计算自变量、因变量、自变量平方、自变量与因变量乘积的和 sum_x = income.YearsExperience.sum() sum_y = income.Salary.sum() sum_x2 = income.YearsExperience.pow(2).sum() xy = income.YearsExperience * income.Salary sum_xy = xy.sum() # 根据公式计算回归模型的参数 b = (sum

Event Recommendation Engine Challenge分步解析第三步

ぃ、小莉子 提交于 2020-05-05 04:18:21
一、请知晓   本文是基于:    Event Recommendation Engine Challenge分步解析第一步    Event Recommendation Engine Challenge分步解析第二步  需要读者先阅读前两篇文章解析 二、用户社交关系信息处理   这一步需要 user_friends.csv.gz 文件,我们先来看看文件内容: import pandas as pd df_user_friends = pd.read_csv('user_friends.csv.gz', compression='gzip') df_user_friends.head()   代码示例结果(发现该记录了用户的所有朋友信息):   1)变量解释    nusers:train.csv 和 test.csv 文件涉及的所有用户数目,3391    self.numFriends: 一维向量,每个元素记录了(3391个)每个用户的朋友数目,然后除以总的朋友数( sumNumFriends ),得到每个用户的朋友占比 import scipy.io as sio import pandas as pd numFriends = sio.mmread('UF_numFriends') pd.DataFrame(numFriends)    代码示例结果:    self

Event Recommendation Engine Challenge分步解析第四步

会有一股神秘感。 提交于 2020-05-05 04:17:29
一、请知晓   本文是基于:    Event Recommendation Engine Challenge分步解析第一步    Event Recommendation Engine Challenge分步解析第二步    Event Recommendation Engine Challenge分步解析第三步   需要读者先阅读前三篇文章解析 二、构建event和event相似度数据   我们先看看 events.csv.gz: import pandas as pd df_events_csv = pd.read_csv('events.csv.gz', compression='gzip') df_events_csv.head()   代码实例结果:    文件记录了用户对某 event 的信息(c_100后面还有一列:c_101):   我们来看看如何对上面表中的列信息进行数值转换   1)start_time:参考 Event Recommendation Engine Challenge分步解析第二步 4) 中的 joinedAt列处理  2)city,3)state,4)zip,5)country列处理都利用了hashlib包:注意这里处理event信息的时候,只有那些出现在train.csv和test.csv中的event才会进入数值转换程序 import

Event Recommendation Engine Challenge分步解析第五步

自闭症网瘾萝莉.ら 提交于 2020-05-05 04:17:04
一、请知晓   本文是基于:    Event Recommendation Engine Challenge分步解析第一步    Event Recommendation Engine Challenge分步解析第二步    Event Recommendation Engine Challenge分步解析第三步    Event Recommendation Engine Challenge分步解析第四步   需要读者先阅读前四篇文章解析 二、活跃度/event热度数据   由于用到 event_attendees.csv.gz 文件,我们先看看该文件 import pandas as pd df_events_attendees = pd.read_csv('event_attendees.csv.gz', compression='gzip') df_events_attendees.head()  代码示例结果(该文件保存了某event出席情况信息):   1)变量解释    nevents:train.csv 和 test.csv 中总共的 events 数目,这里值为13418    self.eventPopularity: 稀疏矩阵,shape为(nevents,1),保存的值是某个event在上图中yes数目-no数目,即一行行处理上述文件

flex 布局

拜拜、爱过 提交于 2020-05-04 12:08:17
FlexiableBox即是弹性盒,用来进行弹性布局,一般跟rem( rem伸缩布局(转) )连起来用比较方便,flexbox负责处理页面布局,然后rem处理一些flex顾及不到的地方(rem伸缩布局主要处理尺寸的适配问题),布局还是要传统布局的。 布局的传统解决方案,基于 盒状模型 ,依赖 display 属性 + position 属性 + float 属性。它对于那些特殊布局非常不方便,比如, 垂直居中 就不容易实现。 2009年,W3C提出了一种新的方案—-Flex布局,可以简便、完整、响应式地实现各种页面布局。目前,它已经得到了所有浏览器的支持,这意味着,现在就能很安全地使用这项功能。 Flex布局将成为未来布局的首选方案。本文介绍Flex布局的语法。 以下内容主要参考了下面两篇文章: A Complete Guide to Flexbox 和 A Visual Guide to CSS3 Flexbox Properties 。 一、Flex布局是什么? Flex是Flexible Box的缩写,意为”弹性布局”,用来为盒状模型提供最大的灵活性。 任何一个容器都可以指定为Flex布局。 .box{display:flex;} 行内元素也可以使用Flex布局。 .box{display:inline-flex;} Webkit内核的浏览器,必须加上-webkit前缀。

数字调制(ASK、FSK、PSK)

时光怂恿深爱的人放手 提交于 2020-05-03 21:50:39
2ASK(二进制幅移键控)又称OOK function askdigital(s,f) % 实现ASK调制 % s——输入二进制序列;f——载波的频率,即:一个码元周期包括f个载波周期 % 调用举例:askdigital([1 0 1 1 0], 2) t=0:2*pi/99:2*pi; %初始化定义,1*100的矩阵 cp=[];mod=[];bit=[]; for n=1:length(s); % 调制过程 if s(n)==0; bit1=zeros(1,100); % 100是码元周期 else % s(n)==1; bit1=ones(1,100); end c=sin(f*t); mod=[mod c]; bit=[bit bit1]; end ask=bit.*mod; subplot(2,1,1); plot(bit,'k','LineWidth',1);grid on; ylabel('Binary Signal'); axis([0 100*length(s) -2.5 2.5]); subplot(2,1,2); plot(ask,'k','LineWidth',1);grid on; ylabel('ASK modulation'); axis([0 100*length(s) -2.5 2.5]);   2FSK:‘1’对应频率为$\omega_1$的载波

MATLAB代写 根轨迹图的稳定性分析

a 夏天 提交于 2020-05-03 21:49:48
原文: http://tecdat.cn/?p=3871 MATLAB 根轨迹图的稳定性分析 根轨迹分析 在下文中,我们提供了用于根轨迹分析的强大MATLAB命令的简要描述。读者可能想知道为什么当强大的MATLAB命令可用时,教师强调学习手工计算。对于给定的一组开环极点和零点,MATLAB立即绘制根轨迹。在极点和零点中进行的任何更改都会立即产生新的根位点,依此类推。 根据我们的背景和能力,我们可能会在一段时间后开始对模式有所了解。也许我们终于开始制定一套规则,使我们能够在极点和零点出现的那一刻快速制作根轨迹的心理草图。换句话说,通过反复试验,我们找到了根轨迹的规则。 通过系统地制定根轨迹的一套规则,我们寻找对系统动态现象的最清晰,最简单的解释。根轨迹的规则使我们能够清楚而准确地理解无限的特征方程组可以创建的无穷模式。我们最终可以在没有这些规则的情况下学会设计,但我们的技能水平永远不会那么高,或者我们的理解也不会那么好。对于其他分析技术也是如此,例如Bode图,Nyquist图,Nichols图等,在本课程后面将介绍。 MATLAB允许特征方程的根轨迹 1 + G(s)H(s)= 0 用rlocus(GH)命令绘制 。可以使用[K,p] = rlocfind(GH)命令以交互方式选择根轨迹上的点(将十字准线放置在适当的位置)。然后MATLAB

octomap点云压缩

时间秒杀一切 提交于 2020-05-03 19:28:27
如果点云文件比较大,可以利用octomap库对点云进行压缩。 octomap以八叉树结构对点云进行组织,是一种有损压缩,定义不同的分辨率可以保存不同尺度的数据。 这里以 rabbit.pcd 文件为例,分别将点云保存为文本格式(.txt),二进制格式(.bin),八叉树格式(.ot),八叉树二进制模式(.bt),对比存为不同格式文件的大小。 程序运行需要安装pcl和octomap,示例如下: #include <iostream> #include <vector> #include <pcl/io/pcd_io.h> #include <pcl/point_types.h> #include <octomap/octomap.h> #include <octomap/OcTree.h> using namespace std; class PointCloudInfo { public : typedef boost::shared_ptr <PointCloudInfo> Ptr; /* !< Point cloud information shared point */ typedef boost::shared_ptr < const PointCloudInfo> ConstPtr; /* !< Point cloud information shared point