大數(shù)據(jù)分析及可視化技術應用實戰(zhàn)培訓班
咨詢電話:010-64707530
各有關單位:
一、課程特色
1. 本課程盡量避開數(shù)學公式,按照“講清思想方法原理—結合具體案例—R語言實現(xiàn)細節(jié)”思路,讓即使是幾乎沒有什么基礎的學員,掌握數(shù)據(jù)挖掘和可視化的基本思路和模式,打下未來深入的良好基礎,能在工作和學習中結合具體問題立馬上手操作解決;
2. 課程注重學練結合的方法,會采取課中練習的方法,充分調(diào)動大家思考的積極性,在做中掌握相關知識和技能;
3. 課程緊緊抓住基于R語言的數(shù)據(jù)挖掘和可視化的重點和難點,詳細的分析和講解,在理解難、容易出錯的地方反復提醒,以便學員在課后容易的進行自己復習和相關拓展。
二、 培訓對象
三、課程大綱
時間 |
知識模塊 |
授課內(nèi)容 |
**天 上午 |
數(shù)據(jù)處理及復雜數(shù)據(jù)可視化(一) |
**講 大數(shù)據(jù)挖掘及可視化介紹 ? 數(shù)據(jù)挖掘及可視化背景 ? 數(shù)據(jù)挖掘流程 ? 常用挖掘工具介紹 ? R語言的優(yōu)勢 ? R數(shù)據(jù)挖掘可視化工具-Rattle**上手 ? R語言對復雜數(shù)據(jù)可視化的優(yōu)勢 ? R語言**入門 ? 利用caret包做數(shù)據(jù)抽樣及虛擬化處理 |
**天 下午 |
數(shù)據(jù)處理及復雜數(shù)據(jù)可視化(二) |
第二講 數(shù)據(jù)質量分析及高級可視化 ? 缺失值處理的高級方法 ? 異常值甄別的高級方法 ? 數(shù)據(jù)可視化進階:lattice及ggplot2包介紹 ? 數(shù)據(jù)交互可視化:rCharts、recharts、networkD3、plotly等包介紹 |
第二天 上午 |
數(shù)據(jù)挖掘模型實戰(zhàn)(一) |
第三講 聚類分析及R語言實現(xiàn) 聚類分析是一種原理簡單、應用廣泛的數(shù)據(jù)挖掘技術。顧名思義,聚類分析即是把若干事物按照某種標準歸為幾個類別,其中較為相近的聚為一類,不那么相近的聚于不同類。 ? 案例一:對著名的鳶尾花數(shù)據(jù)進行K均值聚類分析 ? 案例二:對汽車數(shù)據(jù)進行K均值聚類分析 ? 案例三:對洛杉磯街區(qū)數(shù)據(jù)進行層次聚類 ? 案例四:對汽車數(shù)據(jù)進行層次聚類 第四講 關聯(lián)規(guī)則及R語言實現(xiàn) 關聯(lián)規(guī)則(著名的“啤酒和尿布”)是數(shù)據(jù)挖掘的基礎和核心技術之一,本講將著重圍繞經(jīng)典的Apriori算法,闡明關聯(lián)規(guī)則的支持、置信和提升程度與控制,使用R語言**完成關聯(lián)規(guī)則分析,并**arulesViz擴展包對關聯(lián)規(guī)則進行可視化展示。 案例:利用超市購物籃Groceries數(shù)據(jù)進行關聯(lián)規(guī)則分析 |
第二天 下午 |
數(shù)據(jù)挖掘模型實戰(zhàn)(二) |
第五講 KNN近鄰算法及R語言實現(xiàn) KNN(k-Nearest Neighbor)分類算法是數(shù)據(jù)挖掘分類技術中較簡單的方法之一。所謂k*近鄰,就是k個*近的鄰居的意思,說的是每個樣本都可以用它*接近的k個鄰居來代表。 ? 案例一:對鳶尾花數(shù)據(jù)集進行knn分類 ? 案例二:對乳腺癌數(shù)據(jù)進行knn分類 ? 案例三:對文本數(shù)據(jù)進行knn分類 第六講 決策樹分類及R語言實現(xiàn) 決策樹是數(shù)據(jù)挖掘的經(jīng)典方法,其原理容易被理解。本講主要講授兩種*為普遍的決策樹算法:CART和C5.0算法,使用rpart和C50函數(shù)進行R語言分析。 ? 案例一:對鳶尾花數(shù)據(jù)集運用C50算法分類 ? 案例二:對鳶尾花數(shù)據(jù)集運用CART算法進行分類 ? 案例三:對汽車數(shù)據(jù)運用CART對汽車重量進行預測 |
第三天 上午 |
行業(yè)應用案例分享(一) |
第七講 深度挖掘用戶付費行為及社會網(wǎng)絡分析 ? 對用戶的購買行為進行購物籃分析 ? 智能推薦系統(tǒng)常用算法介紹 ? 對用戶購物行為構建智能推薦系統(tǒng) ? 社會網(wǎng)絡圖基本知識 ? 利用R語言繪制社會網(wǎng)絡圖 ? 利用Gephi繪制社會網(wǎng)絡圖 ? 對用戶購物行為進行聚類分析,發(fā)現(xiàn)社群 |
第三天 下午 |
行業(yè)應用案例分享(二)
|
第八講 航空公司客戶價值分析 ? 背景與挖掘目標 ? 分析方法及過程 ? 數(shù)據(jù)探索分析 ? 數(shù)據(jù)預處理 ? 模型構建 ? 模型應用 |
第九講 漏斗模型及路徑分析 ? 漏斗模型的主要應用場景 ? 路徑分析的主要應用場景 ? 漏斗模型與路徑分析的不同點 ? sunburst事件路徑圖的繪制方法 ? 利用基于時序的關聯(lián)規(guī)則對點擊事件進行分析 |
||
第四天 |
學習考核與業(yè)內(nèi)經(jīng)驗交流 |
四、授課師資
謝老師 計算機碩士,數(shù)據(jù)分析與可視化專家,高級培訓講師。中國R語言資深顧問,WOT“互聯(lián)網(wǎng) ”大數(shù)據(jù)技術、百城沙龍大數(shù)據(jù)沙龍廣深兩地特邀顧問。目前就職于某集團上市公司的高級數(shù)據(jù)分析師,主要利用R語言進行大數(shù)據(jù)的挖掘和可視化工作。本人從事數(shù)據(jù)挖掘建模工作已有8年,曾經(jīng)從事過咨詢、電商、電購、電力、游戲等行業(yè),了解不同領域的數(shù)據(jù)特點。有豐富的利用R語言進行數(shù)據(jù)挖掘實戰(zhàn)經(jīng)驗,部分研究成果曾獲得國家專利。培訓過的精品課程有:《R語言基礎培訓》、《Rattle:可視化數(shù)據(jù)挖掘工具》、《數(shù)據(jù)分析之R語言實戰(zhàn)》、《機器學習與R語言實踐》、《R語言與文本挖掘》
鐘老師 現(xiàn)任職于中科院某研究所,高級工程師,副高職稱,博士畢業(yè)于中國科學院計算技術研究所,獲工學博士學位(計算機系統(tǒng)結構方向)。中培教育的大數(shù)據(jù)、云計算、移動互聯(lián)網(wǎng)系列課程建設與教學專家。近七年來帶領團隊主要從事大數(shù)據(jù)與云計算技術項目的研發(fā)與IT項目管理工作。鐘老師有著多年的企業(yè)內(nèi)訓和公開課培訓講師經(jīng)歷,主講大數(shù)據(jù)平臺技術、云計算、移動互聯(lián)網(wǎng)、電子商務、IT信息軟件項目管理、企業(yè)信息化規(guī)劃與管理、IT戰(zhàn)略規(guī)劃與企業(yè)架構、數(shù)據(jù)中心主機規(guī)劃與IDC系統(tǒng)運營等企業(yè)實戰(zhàn)類培訓課程。
五、培訓費用
面授班培訓費5800 元/人(含場地費、考試證書費、教材費、學習期間的午餐費) 食宿統(tǒng)一安排,費用自理。請學員帶二寸彩照1張(背面注明姓名),身份證復印件一張;
本課程學習考核**后由中國信息化培訓中心頒發(fā)《大數(shù)據(jù)開發(fā)高級架構師》證書,證書可作為專業(yè)技術人員職業(yè)能力考核的證明,以及專業(yè)技術人員崗位聘用、任職、定級和晉升職務的重要依據(jù)。
關于我們
中培教育是由北京中培偉業(yè)管理咨詢有限公司發(fā)展壯大而來,目前中培教育擁有國內(nèi)*知名的技術、管理專家組成的講師和咨詢顧問團隊,同時擁有一批國內(nèi)外知名企業(yè)的高層經(jīng)理和資深專家。中國信息化培訓中心提供的所有培訓課程均由具有豐富教學和實戰(zhàn)經(jīng)驗的業(yè)內(nèi)**開發(fā),既**了課程知識體系架構的完整性,又能確保課程與企業(yè)實際緊密結合,極具可操作性和實用價值。
中培教育嚴格按照ISO9001國際質量管理體系標準及咨詢服務業(yè)標準規(guī)范,建立標準化的服務流程,對我們的培訓、咨詢服務實施全過程質量控制,與顧客充分溝通,關注顧客反饋,**客戶需求的完美實現(xiàn)。
中培教育以推進中國信息化發(fā)展為使命,客戶的良好評價是對我們*好的褒獎。專業(yè)的技術、先進的理念、規(guī)范的管理,是我們?yōu)槠髽I(yè)服務的有力**。