課程大綱
時(shí)間 |
知識(shí)模塊 |
授課內(nèi)容 |
**天 上午 |
數(shù)據(jù)處理及復(fù)雜數(shù)據(jù)可視化(一) |
**講 大數(shù)據(jù)挖掘及可視化介紹 ? 數(shù)據(jù)挖掘及可視化背景 ? 數(shù)據(jù)挖掘流程 ? 常用挖掘工具介紹 ? R語言的優(yōu)勢(shì) ? R數(shù)據(jù)挖掘可視化工具-Rattle**上手 ? R語言對(duì)復(fù)雜數(shù)據(jù)可視化的優(yōu)勢(shì) ? R語言**入門 ? 利用caret包做數(shù)據(jù)抽樣及虛擬化處理 |
**天 下午 |
數(shù)據(jù)處理及復(fù)雜數(shù)據(jù)可視化(二) |
第二講 數(shù)據(jù)質(zhì)量分析及高級(jí)可視化 ? 缺失值處理的高級(jí)方法 ? 異常值甄別的高級(jí)方法 ? 數(shù)據(jù)可視化進(jìn)階:lattice及ggplot2包介紹 ? 數(shù)據(jù)交互可視化:rCharts、recharts、networkD3、plotly等包介紹 |
第二天 上午 |
數(shù)據(jù)挖掘模型實(shí)戰(zhàn)(一) |
第三講 聚類分析及R語言實(shí)現(xiàn) 聚類分析是一種原理簡(jiǎn)單、應(yīng)用廣泛的數(shù)據(jù)挖掘技術(shù)。顧名思義,聚類分析即是把若干事物按照某種標(biāo)準(zhǔn)歸為幾個(gè)類別,其中較為相近的聚為一類,不那么相近的聚于不同類。 ? 案例一:對(duì)著名的鳶尾花數(shù)據(jù)進(jìn)行K均值聚類分析 ? 案例二:對(duì)汽車數(shù)據(jù)進(jìn)行K均值聚類分析 ? 案例三:對(duì)洛杉磯街區(qū)數(shù)據(jù)進(jìn)行層次聚類 ? 案例四:對(duì)汽車數(shù)據(jù)進(jìn)行層次聚類 第四講 關(guān)聯(lián)規(guī)則及R語言實(shí)現(xiàn) 關(guān)聯(lián)規(guī)則(著名的“啤酒和尿布”)是數(shù)據(jù)挖掘的基礎(chǔ)和核心技術(shù)之一,本講將著重圍繞經(jīng)典的Apriori算法,闡明關(guān)聯(lián)規(guī)則的支持、置信和提升程度與控制,使用R語言**完成關(guān)聯(lián)規(guī)則分析,并**arulesViz擴(kuò)展包對(duì)關(guān)聯(lián)規(guī)則進(jìn)行可視化展示。 案例:利用超市購(gòu)物籃Groceries數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則分析 |
第二天 下午 |
數(shù)據(jù)挖掘模型實(shí)戰(zhàn)(二) |
第五講 KNN近鄰算法及R語言實(shí)現(xiàn) KNN(k-Nearest Neighbor)分類算法是數(shù)據(jù)挖掘分類技術(shù)中較簡(jiǎn)單的方法之一。所謂k*近鄰,就是k個(gè)*近的鄰居的意思,說的是每個(gè)樣本都可以用它*接近的k個(gè)鄰居來代表。 ? 案例一:對(duì)鳶尾花數(shù)據(jù)集進(jìn)行knn分類 ? 案例二:對(duì)乳腺癌數(shù)據(jù)進(jìn)行knn分類 ? 案例三:對(duì)文本數(shù)據(jù)進(jìn)行knn分類 第六講 決策樹分類及R語言實(shí)現(xiàn) 決策樹是數(shù)據(jù)挖掘的經(jīng)典方法,其原理容易被理解。本講主要講授兩種*為普遍的決策樹算法:CART和C5.0算法,使用rpart和C50函數(shù)進(jìn)行R語言分析。 ? 案例一:對(duì)鳶尾花數(shù)據(jù)集運(yùn)用C50算法分類 ? 案例二:對(duì)鳶尾花數(shù)據(jù)集運(yùn)用CART算法進(jìn)行分類 ? 案例三:對(duì)汽車數(shù)據(jù)運(yùn)用CART對(duì)汽車重量進(jìn)行預(yù)測(cè) |
第三天 上午 |
行業(yè)應(yīng)用案例分享(一) |
第七講 深度挖掘用戶付費(fèi)行為及社會(huì)網(wǎng)絡(luò)分析 ? 對(duì)用戶的購(gòu)買行為進(jìn)行購(gòu)物籃分析 ? 智能推薦系統(tǒng)常用算法介紹 ? 對(duì)用戶購(gòu)物行為構(gòu)建智能推薦系統(tǒng) ? 社會(huì)網(wǎng)絡(luò)圖基本知識(shí) ? 利用R語言繪制社會(huì)網(wǎng)絡(luò)圖 ? 利用Gephi繪制社會(huì)網(wǎng)絡(luò)圖 ? 對(duì)用戶購(gòu)物行為進(jìn)行聚類分析,發(fā)現(xiàn)社群 |
第三天 下午 |
行業(yè)應(yīng)用案例分享(二)
|
第八講 航空公司客戶價(jià)值分析 ? 背景與挖掘目標(biāo) ? 分析方法及過程 ? 數(shù)據(jù)探索分析 ? 數(shù)據(jù)預(yù)處理 ? 模型構(gòu)建 ? 模型應(yīng)用 |
第九講 漏斗模型及路徑分析 ? 漏斗模型的主要應(yīng)用場(chǎng)景 ? 路徑分析的主要應(yīng)用場(chǎng)景 ? 漏斗模型與路徑分析的不同點(diǎn) ? sunburst事件路徑圖的繪制方法 ? 利用基于時(shí)序的關(guān)聯(lián)規(guī)則對(duì)點(diǎn)擊事件進(jìn)行分析 |
||
第四天 |
學(xué)習(xí)考核與業(yè)內(nèi)經(jīng)驗(yàn)交流 |
這是北京中培教育的大數(shù)據(jù)的課程大綱。如果還想了解更多有關(guān)大數(shù)據(jù)培訓(xùn)的其他內(nèi)容信息,可以來電咨詢我們:010-64707530 金老師 。