【課程特色】
本次課程對(duì)螞蟻金服競(jìng)賽業(yè)務(wù)背景做了簡(jiǎn)單介紹,講述了數(shù)據(jù)分析在拿到數(shù)據(jù)之后應(yīng)該如何開(kāi)始數(shù)據(jù)探索,如何跑出模型baseline,如何通過(guò)可視化及模型輸出進(jìn)行特征選擇,如何理解自定義的評(píng)價(jià)函數(shù),如何用合理的方式記錄上分情況而不發(fā)生混亂,如何充分利用傳統(tǒng)模型和競(jìng)賽殺器,如何根據(jù)模型原理進(jìn)行調(diào)參,如何尋找準(zhǔn)而不同的模型并做出最 優(yōu)的機(jī)器學(xué)習(xí)模型融合,以及最終如何將每一步串聯(lián)到一起拿到最 優(yōu)模型結(jié)果
【招生對(duì)象】
有一定基礎(chǔ)的學(xué)員
【上課時(shí)間】
周一到周日9-18點(diǎn)
【學(xué)習(xí)目標(biāo)】
大化提升實(shí)戰(zhàn)能力
取得數(shù)據(jù)科學(xué)競(jìng)賽TOP名次
拿到比賽豐厚獎(jiǎng)金
斬獲名企offer
【課程內(nèi)容】
01章新手上路
01-01說(shuō)在前面
01-02初識(shí)數(shù)據(jù)科學(xué)競(jìng)賽
01-03支付寶欺詐風(fēng)險(xiǎn)識(shí)別項(xiàng)目導(dǎo)學(xué)
01-04機(jī)器學(xué)習(xí)環(huán)境:jupyter使用
01-05機(jī)器學(xué)習(xí)常用庫(kù)(pandas,scikit-learn)
01-06從業(yè)務(wù)場(chǎng)景認(rèn)識(shí)比賽數(shù)據(jù)
01-07數(shù)據(jù)初探索
01-08快速搭建baseline版本
01-09如何制作線下科學(xué)驗(yàn)證體系
01-10比賽常用回歸任務(wù)評(píng)價(jià)指標(biāo)
01-11比賽常用分類(lèi)任務(wù)評(píng)價(jià)指標(biāo)
01-12支付寶反欺詐自定義評(píng)價(jià)函數(shù)
01-13數(shù)據(jù)內(nèi)存優(yōu)化技巧
01-14數(shù)據(jù)交叉驗(yàn)證
01-15使用內(nèi)置cross_validate接口交叉驗(yàn)證
01-16使用logsitic分類(lèi)模型
01-17使用KNN分類(lèi)模型
01-18使用Adaboost分類(lèi)模型
01-19使用Bagging分類(lèi)模型
01-20使用RandomRorest分類(lèi)模型
01-21使用GBDT分類(lèi)模型
01-21scikit-learn各分類(lèi)模型對(duì)比分析
02章玩轉(zhuǎn)機(jī)器學(xué)習(xí)競(jìng)賽兩大殺器
02-01LightGBM采用scikit-learn方式調(diào)用
02-02LightGBM經(jīng)典方式調(diào)用
02-03LightGBM交叉驗(yàn)證
02-04LightGBM參數(shù)解析
02-05LightGBM輸出特征重要性
02-06LightGBM高級(jí)用法
02-07XGBoost使用
02-08XGBoost參數(shù)解析
02-09LightGBM和Xgboost自定義目標(biāo)函數(shù)
02-10XGBoost與LightGBM對(duì)比分析
02-11LightGBM原理深度解析
03章數(shù)據(jù)處理與特征工程中的騷操作
03-01數(shù)據(jù)探索與處理
03-02數(shù)據(jù)缺失值分析
03-03缺失值高級(jí)處理
03-04特征分析
03-05通過(guò)Adversarial訓(xùn)練方式試探訓(xùn)練集和測(cè)試集分布
03-06特征的IV和WOE編碼
03-07基于模型的特征選擇
03-08基于scikit-learn中RFECV的特征選擇
03-09使用熱力圖分析特征相關(guān)性
03-10使用核密度圖分析特征相關(guān)性
03-11類(lèi)別不平衡分析
03-11類(lèi)別不平衡分析
03-12基于模型的類(lèi)別不平衡處理
03-13基于數(shù)據(jù)采樣的類(lèi)別不平衡處理
03-14灰樣本拒絕推斷方案
03-15多種方式特征選擇
03-16特征分布不均勻的處理策略
03-17困難樣本分析
04章模型花式融合調(diào)參
04-01網(wǎng)格搜索優(yōu)化模型參數(shù)
04-02貝葉斯方法優(yōu)化模型參數(shù)
04-03機(jī)器學(xué)習(xí)比賽中隨機(jī)種子的作用
04-04模型的偏差與方差分析
04-05準(zhǔn)而不同模型選擇策略
04-07stacking的模型融合策略
04-08模型之間的相關(guān)性分析
04-09螞蟻金服項(xiàng)目方案整合
【師資力量】
吳昊天
擅長(zhǎng)數(shù)據(jù)架構(gòu)、數(shù)據(jù)分析
教學(xué)經(jīng)驗(yàn)8年
電子科技大學(xué)大數(shù)據(jù)中心
CDA數(shù)據(jù)分析研究院技術(shù)負(fù)責(zé)人兼高級(jí)講師
趙仁乾
擅長(zhǎng)數(shù)據(jù)架構(gòu)、數(shù)據(jù)分析
教學(xué)經(jīng)驗(yàn)7年
北京郵電大學(xué)管理科學(xué)與工程碩士
北京電信規(guī)劃設(shè)計(jì)院
辛立偉
擅長(zhǎng)數(shù)據(jù)架構(gòu)、數(shù)據(jù)分析
教學(xué)經(jīng)驗(yàn)20年
CDA數(shù)據(jù)分析研究院講師
SUN中國(guó)社區(qū)會(huì)員
【學(xué)員風(fēng)采】
【學(xué)習(xí)周期】
320課時(shí)
【學(xué)員評(píng)價(jià)】
孔同學(xué)
統(tǒng)計(jì)學(xué)和數(shù)據(jù)挖掘理論是數(shù)據(jù)分析的基礎(chǔ),常規(guī)的統(tǒng)計(jì)理論和數(shù)據(jù)挖掘算法必須要學(xué)會(huì),想入行應(yīng)重點(diǎn)研究,并要學(xué)會(huì)制作風(fēng)險(xiǎn)評(píng)分卡。其他算法了解即可。
董同學(xué)
三個(gè)月的學(xué)習(xí)時(shí)間。緊湊的課程安排讓我感覺(jué)每一天都特別充實(shí),白天認(rèn)真聽(tīng)講,晚自習(xí)鞏固復(fù)習(xí),每一天都在進(jìn)步和成長(zhǎng)。 我對(duì)未來(lái)充滿了希望。
王同學(xué)
CDA的學(xué)習(xí)經(jīng)歷,給我的人生增添了一段難忘的回憶,也給我在現(xiàn)在的工作中帶來(lái)了很大的幫助,在今后的工作中要更加努力,不斷完善自己。
蘇同學(xué)
學(xué)習(xí)是一種態(tài)度,在CDA三個(gè)月集中學(xué)習(xí)的過(guò)程中,認(rèn)識(shí)了很多同學(xué),也增長(zhǎng)了一些校園以外的知識(shí),學(xué)習(xí)的過(guò)程很累很艱辛,卻覺(jué)得很值得! 痛并快樂(lè)著?。?/p>
李同學(xué)
CDA對(duì)于我而言,是一個(gè)新生活的起點(diǎn),經(jīng)過(guò)3個(gè)月的奮戰(zhàn),我學(xué)習(xí)到了許多知識(shí),更結(jié)識(shí)了許多志同道合的朋友,這是我3個(gè)月的學(xué)習(xí)生活寶貴的財(cái)富。
趙同學(xué)
首先感謝的是課堂里茫茫多的教授級(jí)導(dǎo)師的個(gè)人魅力的熏陶,其次就是,三個(gè)月持續(xù)不斷的學(xué)習(xí),讓我養(yǎng)成一個(gè)持續(xù)學(xué)習(xí)的心態(tài)和熱愛(ài)學(xué)習(xí)的態(tài)度。
【機(jī)構(gòu)簡(jiǎn)介】
如荷學(xué)為北京國(guó)富如荷網(wǎng)絡(luò)科技有限公司旗下專(zhuān)注于數(shù)字化人才培養(yǎng)及服務(wù)的教育品牌,致力于大數(shù)據(jù)在產(chǎn)、學(xué)、研的融合應(yīng)用。服務(wù)百萬(wàn)數(shù)字化人才,是全球500強(qiáng)企業(yè)的忠實(shí)合作伙伴。
如荷學(xué)以"培養(yǎng)企業(yè)需要的專(zhuān)業(yè)數(shù)字化人才,搭建弓|領(lǐng)數(shù)字化時(shí)代的企業(yè)人才梯隊(duì)”為使命,為T(mén)D時(shí)代數(shù)字化人才的數(shù)據(jù)能力提升及企業(yè)數(shù)字化轉(zhuǎn)型提供標(biāo)準(zhǔn)化、效率、可落地的數(shù)據(jù)應(yīng)用側(cè)解決方案。
【機(jī)構(gòu)環(huán)境】
【發(fā)展歷程】
2006年 開(kāi)展數(shù)據(jù)統(tǒng)計(jì)、計(jì)量實(shí)戰(zhàn),學(xué)術(shù)研究等相關(guān)培訓(xùn)視頻和現(xiàn)場(chǎng)班
2007年 開(kāi)展數(shù)據(jù)統(tǒng)計(jì)、數(shù)據(jù)分析相關(guān)培訓(xùn)班
2011年 隨著大數(shù)據(jù)熱潮的來(lái)臨,依托累計(jì)上萬(wàn)類(lèi)共享資料,多年沉淀師資團(tuán)隊(duì),論壇召集多位專(zhuān)家,研發(fā)CDA數(shù)據(jù)分析師體系
2013年CDA數(shù)據(jù)分析師品牌成立,提供系統(tǒng)化的大數(shù)據(jù)、數(shù)據(jù)分析人才培養(yǎng)和認(rèn)證
2014年 CDA INSTITUTE 成立 ,并推出第 一屆全國(guó)CDA數(shù)據(jù)分析師認(rèn)證考試
2015年第 一屆中國(guó)數(shù)據(jù)分析師行業(yè)峰會(huì)(CDAS)在9月11日成功舉辦,參會(huì)人數(shù)逾3000人
2016年 CDA匯聚海內(nèi)外大數(shù)據(jù)、數(shù)據(jù)分析專(zhuān)家上千人,推出就業(yè)班、數(shù)據(jù)科學(xué)家訓(xùn)練營(yíng)、企業(yè)內(nèi)訓(xùn)、CDA俱樂(lè)部等多個(gè)項(xiàng)目
2017年整合論壇與CDA數(shù)據(jù)分析師業(yè)內(nèi)資源,形成數(shù)據(jù)分析領(lǐng)域生態(tài)圈,并進(jìn)一步升級(jí)CDA企業(yè)內(nèi)訓(xùn)體系,正式推出大數(shù)據(jù)實(shí)驗(yàn)室
2018年北上廣深等多個(gè)城市均有校區(qū);擁有200多位專(zhuān)業(yè)師資;培養(yǎng)學(xué)員超過(guò)3萬(wàn)人,每年6月/12月全國(guó)28個(gè)城市舉辦CDA認(rèn)證考試
2019年已舉辦九屆數(shù)據(jù)分析師認(rèn)證考試,得到業(yè)界廣泛認(rèn)可,學(xué)員遍布各大知名企業(yè)。人工智能產(chǎn)品“好學(xué)AI”問(wèn)世,引領(lǐng)DT時(shí)代新一波技術(shù)培訓(xùn)浪潮