大數據的處理與分析已成為資訊科技、商業經營、科學研究相關從業人員所需的技能。而許多經典的統計或機器學習的方法、範例、甚至於教材都是使用 R 語言來實作與開發,這使得R 語言成為一個專業數據科學家必需掌握的程式語言。而隨著近年來學習R語言的熱門,相關的課程與書籍也相繼推出。可惜的是,坊間的教材多數只討論基礎 R 語言的單機(Single-node)或單線程(Single-threaded)的資料分析方法,很少討論進階 R 語言的平行化 (Parallel)、分散式(Distributed)、與CPU-GPU 異質化(Heterogeneous)等運算,以致於無法真正使用 R 語言處理與分析超出單機記憶體或 CPU核心數能處理的資料量。

藉由龐大的開放原始碼社群支援,R 語言已有許多相關的套件支援多線程(multi-threaded)、平行化、GPU運算、與其它高效能(High-Performance)的資料分析。資策會高雄特別針對已有 R 語言程式設計經驗的學員規劃進階R課程,『Big Data 資料分析-進階R 語言與機器學習』。課程將帶領學員們從簡單的MapReduce 設計模式(Design Patterns)、平行化的機器學習與資料分析方法、如何處理GB 以上或超過主憶體大小的資料、R 語言的深度學習入門、到討論最新可擴展 (Scalable)的 R大數據分析套件使用。也讓學員們未來能使用 R 語言輕鬆完成無論是小型的統計資料分析或是大規模的資料探勘工作。

課程詳細介紹

本課程教導學員使用R 與RStudio軟體進行大數據分析。我們將快速復習 R 語言的語法與資料分析基本概念,輔以 R 語言中的 Split-Apply-Combine與 MapReduce資料分析策略。並以此分析策略為基礎,討論 R 語言的機器學習實務應用與如何實作R 語言的特徵學習與工程來設計與選擇最適合的模型。此外,本課程也將介紹實務上如何使用 R 語言處理大數據與探討高效能的 R 程式設計, 內容包括 R 的向量化運算、函數式程式設計、In-Memory & In-Database Computing,R 深度學習套件、與快速可擴展 (Fast & Scalable) 的R 與 H2O大數據分析.

課程大綱

R 語言與分散式資料分析
1.R語言與資料分析基礎
2.R的Split-Apply-Combine 分析策略與MapReduce 程式設計
3.R與 MapReduce 設計模式 (Design Patterns)

R 語言與機器學習
1.R 語言與模型思考 (Model Thinking)
2.R 語言中的特徵工程(Feature Engineering) 與特徵學習(Feature Learning)方法
3.機器學習基礎—以KNN、 廣義線性模型(Generalized Linear Models)、CART決策樹為例
4.進階機器學習—隨機森林(Random Forest)與整合學習(Ensemble Learning)介紹

高效能R 程式設計 (High-Performance R Programming)
1.R 語言效能探討
2.R 的向量化(Vectorization)與函數式程式設計(Functional Programming)
3.進階資料處理分析—使用 data.table, dplyr, 與 bigmemory套件為例
4.快速與可擴展的R大數據分析—使用 R 、 H2O、與Apache Spark
5.R 語言與深度學習基礎—使用R 與 MXNet

課程難度

中階

課程適合對象

1.已有R 語言程式設計基礎,希望修習進階課程者。
2.有企業營運資料分析實務經驗的部門主管,程式設計師、或決策人員。
3.有實務經驗的資料庫管理、資料庫開發、或商業智慧分析師。
4.有科學計算或統計分析經驗,希望修習 R 語言者

預備知識:因此課程將使用到基本的R軟體操作,建議學員至少先修習過「Big Data資料分析-R軟體實作」或已有R 語言程式設計基礎,再修習本課程。&a

課程時數

14 小時

上課注意事項

已完成報名與繳費之學員,課程主辦單位將於開課三天前以E-mail方式寄發上課通知函;若課程因故取消或延期,亦將以E-mail方式通知,如未收到任何通知,敬請來電確認。

立即報名

早鳥優惠價 8000 元 2018/02/07 00:00 ~ 2018/05/04 00:00 立即報名
一般優惠 12000 元 2018/02/07 00:00 ~ 2018/05/04 00:00 立即報名

本課程由 資策會 數位教育研究所 南區訓練中心 發佈

課程問答

我要提問

對課程有任何問題,都歡迎在這裡向開課單位提問

開課單位

資策會 數位教育研究所 南區訓練中心

資策會數位教育研究所在「教育訓練」方面,秉持與時俱進的理念,因應產業需求,融 入創新、創意與創業的精神,培育各領域優質的科技化服務人才,加強其就業、增能、及創 業的職能,以便面對全球競爭的趨勢。

本中心持續引進與開辦最新科技化服務及資通訊技術課程包含:Big Data、行動加值應 用、專案管理、商業分析、資訊服務管理、研發管理、行銷管理、程式網管、智慧聯 網…等各式前瞻技術,即時培育並提供企業所需優質人才,以協助產業掌握關鍵前瞻科技, 引領企業再造蓬勃商機。

各教室皆有最新穎的軟、硬體設備,並附有舒適明亮的學員休息區及服務設施,讓您享有 最優的活動場地及學習效果。教學設備含投影機、廣播教學系統、無線麥克風、螢幕、白板 等,備有茶水、無線網路,另提供免費市內電話。

資策會 數位教育研究所 南區訓練中心其他精彩課程

0 人收藏

資策會  數位教育研究所  南區訓練中心 資策會 數位教育研究所 南區訓練中心

0 人收藏

資策會  數位教育研究所  南區訓練中心 資策會 數位教育研究所 南區訓練中心

相關課程

0 人收藏

資策會  數位教育研究所  南區訓練中心 資策會 數位教育研究所 南區訓練中心