
Kaggle 數(shù)據(jù)分析項目入門培訓
Kaggle 是一個致力于為數(shù)據(jù)科學家提供舉辦機器學習競賽、
托管數(shù)據(jù)庫、編寫和分享代碼的網(wǎng)站,
已經(jīng)成為全世界數(shù)據(jù)工程師喜歡的平臺之一。
本課程挑選了數(shù)個 Kaggle 上經(jīng)典的項目進行講解,
并結(jié)合學到的知識完成實戰(zhàn)訓練。
希望你能通過本次課程學習到數(shù)據(jù)分析實戰(zhàn)知識,
并踏入 Kaggle 競賽的大門。
1 數(shù)據(jù)導入與數(shù)據(jù)清洗
2 特征工程
3 完成各種預測任務
4 數(shù)據(jù)可視化分析
5 構(gòu)建模型
1
波士頓房價數(shù)據(jù)分析預測
試學
知識點: 1.數(shù)據(jù)導入 2.數(shù)據(jù)預處理 3.預測模型
實驗 2
泰坦尼克號事故生存預測
試學
知識點: 1.相關(guān)性分析 2.缺失值填充 3.邏輯回歸
挑戰(zhàn) 1
Google Play 應用下載數(shù)據(jù)分析
知識點: 1.數(shù)據(jù)預處理 2.數(shù)據(jù)基本信息查看 3.數(shù)據(jù)類型轉(zhuǎn)換
實驗 3
TMDB 電影票房收入預測
知識點: 1.數(shù)據(jù)預處理 2.建立預測模型
實驗 4
房屋信貸違約風險評估預測
1.數(shù)據(jù)導入與預覽
2.數(shù)據(jù)可視化plotly
3.特征工程
4.預測模型的選擇
2
黑色星期五精準營銷可視化分析
1.數(shù)據(jù)可視化
2.plotly工具的使用
5
絕地求生游戲終排名預測
1.數(shù)據(jù)讀取與預覽
2.數(shù)據(jù)可視化
3.構(gòu)建隨機森林預測模型
6
分銷商產(chǎn)品未來銷售情況預測
1.時間序列數(shù)據(jù)
2.數(shù)據(jù)預處理
3
西班牙高速列車票價預測分析
1.數(shù)據(jù)清洗
2.特征工程
3.預測模型構(gòu)建
4
Kaggle 數(shù)據(jù)分析獨立項目挑戰(zhàn)
1.數(shù)據(jù)分析綜合能力
