第二次作业(pandas练习)

匿名 (未验证) 提交于 2019-12-03 00:14:01
import pandas as pd t=pd.DataFrame(pd.read_excel('C:\\Users\\ASUS\\Desktop\\lw\\python高级设计test\\数据文件\\titanic.xlsx')) s=t['survived'].value_counts() print('存活人数为{}\n死亡人数为{}'.format(s[0],s[1]))

s=t['sex'].value_counts() print('male人数为{}\nfemale人数为{}'.format(s[0],s[1]))

 

a = 0 b = 0 for i in t.index:     if t['alive'][i] == 'yes':         if t['sex'][i] == 'male':             a += 1         elif t['sex'][i] == 'female':             b += 1 print("男的获救人数为{}\n女的获救人数为{}".format(a, b))

  

print(t['class'].value_counts())

t = pd.DataFrame(pd.read_excel(file_path)) a = t[['survived', 'pclass']] print(a.corr())

print(t.boxplot(['fare'], ['pclass']))

从图中可看出,船舱等级为1时票价范围较大,船舱等级为2,3时票价范围相对最小

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!