資源簡介
Python數據分析與機器學習-泰坦尼克獲救預測
代碼片段和文件信息
import?pandas?as?pd??#?pandas數據分析數據處理庫
pd.set_option(‘display.height‘?1000)
pd.set_option(‘display.max_rows‘?1000)
pd.set_option(‘display.max_columns‘?1000)
pd.set_option(‘display.width‘?1000)
titanic?=?pd.read_csv(“titanic_train.csv“)
‘‘‘
PassengerId?乘客id
Survived?是否獲救,0未獲救,1獲救
Pclass?倉位等級
Name?姓名
Sex?性別
Age?年齡
SibSp?多少兄弟姐妹一起的
Parch?老人和孩子
Ticket?票號
Fare?票價
Cabin?座位號
Embarked?上船地點
‘‘‘
titanic[“Age“]?=?titanic[“Age“].fillna(titanic[“Age“].median())
#?median?返回給定數值的中值,中值是在一組數值中居于中間的數值
#?fillna對缺失值進行填充
‘‘‘
mean?平均
std?標準差
‘‘‘
#?把性別轉換為01
titanic.loc[titanic[“Sex“]?==?“male“?“Sex“]?=?0
titanic.loc[titanic[“Sex“]?==?“female“?“Sex“]?=?1
#?把上船地點轉換為012
titanic[“Embarked“]?=?titanic[“Embarked“].fillna(‘S‘)
titanic.loc[titanic[“Embarked“]?==?“S“?“Emba
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件???????28629??2017-12-24?16:26??chapter14\test.csv
?????文件???????61194??2017-12-24?16:26??chapter14\titanic_train.csv
?????文件????????6136??2018-01-05?14:02??chapter14\泰克尼克號獲救預測.py
?????目錄???????????0??2018-01-05?14:02??chapter14\
評論
共有 條評論