科技部部長陳良基 : AI時代軟硬整合非常重要,台灣強項顯現!

科技部長陳良基表示,AI時代,軟硬整合非常重要,台灣強項顯現!過去台灣在硬體、半導體領域創造典範,不過在世界邁向軟硬整合的過程中,台灣企業在導入AI的腳步仍稍嫌緩慢。如果你是韌體開發工程師、嵌入式開發工程師、FPGA工程師等工程背景,現在是最好的機會,透過培養AI職能來發揮軟硬整合的價值。若您非理工相關背景,也不需擔心,透過培養AI職能,幫你的本業加分。我們雖然不一定要成為創造AI的工程師,但我們必須了解AI,知道它所影響的層面,才能發揮自身優勢。因為未來是AI的時代,知己知彼才能百戰百勝。

本課程,將先幫您建立對AI人工智慧的正確認知。透過淺顯易懂的概念和產業實務,讓你從實做中,循序漸進學會活用資料處理的Python套件(Numpy、Pandas、Scipy、Matplotlib、Seaborn等);學會用scikit-learn實現機器學習演算法(Regression、Decision Forest、KNN或Kmeans等)、驗證模型績效,並進行參數調校來優化模型;學會用Keras、TensorFlow進行卷積神經網路(CNN)、遞歸神經網路(RNN)、強化學習(Reinforcement learning)、生成對抗網路(Generative Adversarial Networks)等神經網路的搭建,實現如人臉辨識、語音辨識等應用,延伸本業價值。所以面對AI,當你抵抗趨勢,那你就是在和未來作對。但若你選擇欣然擁抱,風向會幫你一把。

【AI小常識】

什麼是機器學習(Machine Learning)?

機器學習是人工智慧的其中一個分支,簡單來說它就是讓機器可以像人一樣,可藉由閱讀大量的資料建立規則而具有知識,而機器學習就是透過演算法來分析數據、從中學習來判斷或預測現實世界裡的某些事(專家其實是訓練有素的狗,機器學習大概就是這個味道) 。閱讀已知的大量資料就是所謂訓練的過程,透過足夠多的Training Data 建立出一個 Model (最佳函式), 這個Model 就是"機器的知識",之後你可以餵未知的資料給機器,機器就能進行預測或判斷 。機器學習並非手動事先用程式撰寫好指令規則來判斷,而是使用大量數據和演算法來「訓練」機器,自動產生規則判斷或預測。

什麼是深度學習(Deep Learning)?

它其實就是很深的Neural Network (Deep Neural Network DNN), 就是中間Hidden Layer 有很多層級。AlexNet 達到8層級, ResNet已達到100多個層級。每建構一個Hidden Layer就代表建立同款式但有著不同花樣的過濾器(Filter)/篩子,以篩出不同的特徵。愈多的Hidden Layer 就代表用了更多款式的篩子。經過Back Propagation 計算後,可求得每種款式每種花樣篩子的權重W。愈重要的篩子權重愈高,而愈不重要的篩子權重就會愈低。 這些W權重較大的篩子,代表用這些篩子可以篩出 X-->Y的重要成份,也就是"特徵"。這也就是深度學習最強的地方--自動特徵擷取,而不是由人來先定義好特徵。(more...)

機器學習或深度學習的技術可以應用在哪?

機器學習的演算法已廣泛應用於資料探勘、電腦視覺、自然語言處理、語音和手寫識別、生物特徵識別、DNA序列測、搜尋引擎、醫學診斷、金融數據分析與證券市場分析等方面。所以幾乎各行各業,包含金融保險業、電信業、零售業、製造業、醫療產業等,都會用到機器學習的技術。而以深度學習作為機器學習的方法,則多用在影像辨識、語音分析,這種比較沒有因果關係或者連人類都很難解釋的邏輯推理。

相關詞:資料科學、機器學習、深度學習、Python、scikit-learn 、Regression、Gradient Descennt、Logistic Regression、Support Vector Machine、Decision Trees、Random Forests、文字探勘、Clustering、Kaggle、Data Mining、Keras、Tensorflow、CSS、RNN、ANN、Kmeans 課程特色

課程詳細介紹

我可以從這門課學到什麼

• 會運用Python矩陣計算與資料處理相關模組的能力,如 Numpy、Pandas、Scipy等。

• 會用Python Matplotlib 進行數據視覺化的能力。

• 了解Regression、Classification、Clustering 相關演算法原理

• 會用Scikit-learn 進行如Logistic Regression、SVM、Decision Tree、Neural Network 等等Machine Learning 的實作。

• 會用Keras/TensorFlow 進行DNN、CNN、RNN實作。

• 掌握機器學習的演算法後,能套用在資料探勘、電腦視覺、自然語言處理、語音和手寫識別等技術領域上。

課程大綱

第一階段

★Python程式語言打底 (數位) ==> 觀看課程大綱
http://www.ittraining.com.tw/ittraining/it-elearning/basic-python

第二階段 28hrs

★資料工程實戰

主題 內容
資料科學利器Python程式語言以及必會函式庫
Python實作環境建置
Anaconda安裝與教學
必會之指令教學:conda create、conda info、pip等
Jupyter Notebook功能教學
必會之Python入門程式語法與資料格式介紹
Python程式實作:程式筆記、數學計算、檔案讀取等
必會之Python資料分析套件: Numpy、Pandas、Scipy、Matplotlib
Numpy 程式實作:必會之數學運算指令
Scipy 程式實作:必會之科學計算與工程計算指令,以影像處理為例
Matplotlib程式實作:必會之圖表繪製指令,直方圖、圓餅圖、趨勢圖、散佈圖等
Pandas程式實作:以連鎖速食餐飲資料集和股價分析為例
Github使用教學:安裝程序、版本控制等
資料工程(Data Engineering) 什麼是資料工程:資料工程觀念介紹與流程說明
資料採集與預處理-使用Pandas
資料檔案採集(Scraping)、網路資料採集(Web Scraping)
程式Python網路爬蟲(Crawler)實作:運用BeautifulSoup套件,解析並抓取網頁資料,以維基百科文章分析為例
資料格式的正規表示式(Regular Expressions)
程式實作:運用Re套件建立規則抓取所需資料,以快速抓取網頁中電話號碼為例
資料重塑(Reshaping)
資料清理(Data Cleanup)
程式實作:必會之資料清理方法實作,以Airbnb住房分析為例
進階資料處理
資料文法(Grammar of Data)介紹
結構式查詢語言(SQL)與資料整理套件dplyr介紹
程式實作:Python SQL資料庫與dplyr必會之指令實作
探索性資料分析(Exploratory Data Analysis, EDA)
探索性資料分析說明:運用視覺化、基本統計等工具,先「看」一下資料
程式實作:使用matplotlib函式庫實作直方圖、圓餅圖、趨勢圖、樹狀圖等
互動式視覺化(Interactive Visualization)
資料科學應用實例
文字探勘(Text Mining)實例
自然語言處理概念介紹與自然語言函式(nltk)教學:斷詞、停用詞、n-gram斷詞方法
利用中文斷詞處理(Jieba)函式庫與頻率分析方法,進行文字雲的建構
利用機率的概念,決定文字的關鍵字、並利用關鍵字進行初步的文章分類
程式實作:新聞文章分類
統計方法與機率分佈概念介紹
★機器學習實戰

主題 內容
Introduction to Machine Learning
何謂機器學習?
機器學習的實現程序? 監督式學習 ?非監督式學習? 半監督式學習?...
名詞介紹: Model、特徵(feature)、標籤(label)、Training data、Testing data、Deep Learning、CNN、RNN...
Machine Learning I: Regression
機器學習實作是以Scikit Learn為主,搭配Python範例程式碼講解

Regression 迴歸
程式實作:波士頓房產價格分析
Ridge Regression & Lasso Regression
評估機器學習模型的好壞
定義損失函數(Loss Function)
均方根誤差(RMSE)
梯度下降演算法(Gradient Descent)
如何縮小RMSE ? 模型與參數的選擇
機器學習模型訓練資料建立方法
如何避免過擬合(Overfitting) & 欠擬合(Underfitting)
交叉驗證法(Cross Validation)
拔靴驗證法(Bootstrap Validation)
資料標準化(Standardization)說明與標準化套件(StandardScaler)教學
降維(Dimension Reduction):主成分分析(PCA)
程式實作:葡萄酒種類分析
判斷模型預測能力的方法
混淆矩陣、準確率(Precison)、覆蓋率(Recall,也叫作召回率)、皮氏F-分數(Piotroski F-Score ,FSC)、ROC曲線、AUC曲線
Machine Learning II: Classification & Clustering
分類(Classification):以IRIS、披薩公司資料集進行說明與實作
單純貝式分類器(Naive Bayes Classifier)
機率生成模式(Probabilistic Generative Model)
羅吉斯迴歸(Logistic Regression)
決策樹(Decision Trees)
隨機森林(Random Forests)
支持向量機(Support Vector Machine)
最近距離分群法(KNN)
分群(Clustering)
K-means
整體性方法(Ensemble Methods)概念解說與實作
如何有效進行實驗性設計(Experimental Design)
專案實務
知名資料競賽平台(Kaggle、天池等)介紹與教戰守則說明
Kaggle競賽神器XGBoost
競賽實例解說
本課程的實戰專案將以BOSCH實際釋出的生產線大數據資料進行分析,學員可以一步一步從特徵選取工程實作機器學習的各項過程,選取適合的機器學習方法進行機器學習模型建構,並應用效能評估方法與交叉驗證方法增強模型的有效性。
專案目標一: 利用迴歸方法建立初步的良率出影響良率的因子以及預測準度
專案目標二: 利用其他的機器學習方法,包括單一的機器學習方法或是多個機器學習方法整合,有效地找出影響良率的重要因子與預測準度,進而達成預防性維保與設備監診的目標
第三階段

★深度學習(Deep Learning)實戰 21hrs

主題 內容
深度學習實戰
深度學習實作是以 Keras、TensorFlow 深度學習平台為主

常用深度學習硬體與框架
Deep Learning常用GPU介紹:Nvidia GTX 1080Ti…
GPU配置教學與效能評估
框架介紹(TensorFlow、Keras、CUDA… )
Google Colaboratory環境建置與操作
神經網路與深度學習架構
機器學習 vs 深度學習
Deeper Neural Network (DNN)說明:
Neural Network 的原理與架構:Neuron(神經元)、Perceptron(感知器)
Activation Function(激勵函數): Relu、Sigmoid、tanh…
Optimization(最佳化):線性回歸、Gradient Descent(梯度下降法)、SGD(隨機梯度下降法) 、 momentum(動量法)…
過擬合(Overfitting)處理:Dropout、Regularization
實戰演練:神經網路實作、MNIST手寫數字辨識、CIFAR-10實作、乳腺癌診斷分析
深度學習方法
卷積神經網路(CNN):
原理與架構說明: Convolutional Layer (卷積層)、Pooling Layer (池化層)、Fully Connected Layer (全連階層)。
常用模型應用說明:VGG16、VGG19、ResNet50、InceptionV3
其他方法說明:Backpropagation(反向傳播法)、Autoencoder
CNN與影像辨識實務應用說明:分類(Classification)、Semantic按語意切割(Segmentation)、定位(Classification + Localization)、物體偵測(Object Detection)、實體切割(Instance Segmentation)。 實戰演練:模型實作(載入模型、訓練模型、新建模型、調整參數、績效評估、Fine-tuning)、圖片辨識、圖片去雜訊
遞歸神經網路(RNN):
原理與架構說明:
Gradient Vanish(梯度消失)
LSTM(Long Short-Term Memory)模型說明
應用說明:時間序列(Time series)、自然語言處理(Nature language processing)、語音辨識
實戰演練:美國國際航空乘客量分析、情緒分析、中英翻譯
深度學習應用
遷移式學習(Transfer Learning)
原理說明:Keras後端函數應用、反轉梯度
實戰演練:圖像風格化
生成對抗網路(Generative Adversarial Networks)
生成器 (Generator) 和鑑別器 (Discriminator)
改進的版本介紹
強化學習(Reinforcement Learning)
原理說明:自動進行決策,並且可以做連續決策
四個元素:agent、環境狀態、行動、獎勵
Q-Learning說明
逆向增強式學習 (Inverse Reinforcement Learning)
實戰演練:訓練電腦玩遊戲、機器人運動控制
發展與部署深度學習系統時,在操作層面上的考量
PS.實戰演練的範例將會依據產業界的實際狀況進行調整。

課程難度

入門

課程適合對象

• 需要運用機器學習(Machine Learning)技術改善工廠生產、生產異常判斷、生產排程等專案的您。

• 想學會機器學習與研發分析優化、資料處理之演算法,包含建立統計模型、設計資料分析演算法、測試與調校的您。

• 需要進行大數據建模及程式開發、處理大量結構與非結構資料、應用資料探勘方法建立客戶分群或預測模型的您。

• 沒相關背景

課程時數

49 小時

上課注意事項

常見問題
1.)為什麼要學習機器學習?

機器學習觸動每個人的生活,它取決於我們所有的人,自主決定我們想要用它來做什麼。憑藉著你對機器學習的新理解,你處於一個更好的位置,可以去思考類似隱私和數據資料分享、未來的工作、機器人作戰,以及人工智慧的希望和危險等問題;如果我們有越多人擁有這樣的理解,我們就越可能可以避免重蹈覆轍,並找到正確成功途徑。如今亞馬遜的演算法,讓世界各地任何人都能便捷決定要閱讀什麼書籍;美國國家安全局的演算法,可以判斷你是否為潛在的恐怖攻擊分子;氣候模型(Climate models)決定什麼是二氧化碳在大氣中的安全水平;選股模型(Stock-picking models)所驅動的股市交易量,甚至遠超過大多數人所做的。基本上,因為你無法控制自己不理解的東西,所以做為公民、專業人士,以及從事幸福追尋的人們,這就是為什麼你需要了解機器學習的原因。

2.)用56小時學機器學習與深度學習會太長嗎?

不會!講師希望可以透過49小時的課程,能帶大家循序漸進掌握機器學習與深度學習的技術精華,並能從原理到程式的實作,之後大家可以真的去結合本身產業的知識為公司創造價值。如果只是1天的研討會或數小時的工作坊,除非是已經具備數據分析基礎的學員,否則大部分的人在結束後,仍然對機器學習與深度學習一知半解(通常是知道了有一個趨勢加上一些似懂非懂的名詞),更別說是實際動手開發。

3.)機器學習一定要很會寫程式嗎?

資料分析人員也不一定看得懂每一行程式碼,但通常他會具備某一領域知識並懂得如何分析數據。可透過本課程了解觀念與原理,再利用課堂上的程式碼架構,依據不同目的進行參數調整,其實也能快速達到資料分析的目的。

4.)為什麼選擇Python而不是R語言?

因Python較R擁有下列優點 :

  1. 網絡爬蟲/抓取:儘管 rvest 已經讓 R 的網絡爬蟲/抓取變得容易,但 Python 的 beautifulsoup 和 Scrapy 更加成熟、功能更強大,結合django-scrapy我們可以很快的構建一個定製化的爬蟲管理系統。
  2. 連接資料庫:R 提供了許多連接資料庫的選擇,但 Python 只用 sqlachemy 通過ORM的方式,可解決了多種資料庫連接的問題,且在生產環境中廣泛使用。
  3. 內容管理系統:基於Django,Python可以快速通過ORM建立資料庫、後台管理系統,而R中的 Shiny 的鑒權功能暫時還需要付費使用。
  4. API構建:通過Tornado這個標準的網路函式庫,Python也可以快速實現輕量級的API,而R則較為複雜。

5.)不會Python可以上課嗎?
老師一開始會先帶大家快速掌握Python程式語言,您當然也可以先參考艾鍗的Python程式語言先修班(線上課程)。課程中老師會以手把手方式解釋Sample Code,並讓您透過程式的執行更快理解該段程式碼所做的事。另外,講師所提供的Sample Code都有清楚的程式註解,也能方便您快速掌握程式的意涵。當然,Python 語言的熟悉度還是得透過多加練習而熟能生巧 ,或者應該說任何程式語言其實都是熟能生巧 : )

6.) 會資料科學,數學是不是要很好?

若要自己設計發明一個更好的分類器 (Classifier)演算法,一定程度的數學能力肯定避免不了,而資料科學底層的數學主要以機率統計、線性代數為主。我們上課時,講師會告訴你這個這個模型的方法其基礎理論原理是什麼,再配合實際程式的執行讓您可以快速連結演算法的精義。然而,資料科學也不光只是算數學或寫程式,對於對特定領域的了解、清楚的分析邏輯、對資料的敏感度,也是相當重要的。

7.)自學機器學習與深度學習的艱難在哪呢?

困難1:若想透過網路學習,因網路知識過於片段,深淺不一,學習成效有限。

困難2:若想透過書籍學習,因目前相關技術中譯本不多,主要仍以英文為主,語言門檻是學習者的第一個門檻;即使有中譯本,大部分仍翻譯艱澀並充斥著大量的複雜公式和程式,不夠親和,讓讀者有很大的學習障礙。

因此,若沒有專業的老師帶著學,學習不但事倍功半且無法確定所學到的知識是否正確,更不用說能學到業界真實的分析與Debug經驗。

8.) 實驗性設計指的是什麼?

建立機器學習模型就好像在做實驗一樣,每一次的實驗都會選擇不同的特徵、機器學習演算法與參數,甚至是問題的假設,每一次的實驗都會增加你對於資料的理解,課程將會逐步教你如何掌握這些流程與訣竅

9.)資料重塑&資料清理(Data Cleanup)的意義?

資料重塑(Reshaping):整合兩個不同來源的表格、合併資料行、合併資料列、資料表排序、將某欄位分割成兩個欄位等。資料清理(Data Cleanup):處理資料缺陷、統一資料格式與單位、處理缺漏值、將空值設定為預設值、移除不完整的列、統一資料型態、大小寫轉換以及文字處理(取代)。

10.)課程實作的環境為何?

教學上以Linux Ubuntu 16.04LTS 為主,並且以 Python 3 搭配Jupyter 讓學員能快速演練

11.)請問課程是運用哪種運算平台進行深度學習實作呢?

課程中使用Google的開發工具Colaboratory來進行深度學習實作。Google Colaboratory是一個提供Jupyter Notebook服務的雲端環境,而且無須額外複雜的設定就可以使用,更棒的是還有提供免費的GPU運算服務。

12.)上課需要另外購買書籍嗎?

上課會使用授課講師親編的講義

13.)課後仍有不懂的地方可否詢問?

歡迎於本課程的討論板上提出問題,艾鍗的講師或助教都會很樂意為您解答!(討論版網址會在上課第一天公佈)

14.)課程如何報名及繳費?

填寫報名表並完成繳費,繳費方式可採取:

  • ATM轉帳 或 臨櫃匯款
    銀行代碼: 008 帳號: 100-10-032218-5
    華南商業銀行 總行營業部
    戶名: 艾鍗科技有限公司
  • 信用卡分期
  • 現金繳款
    有任何問題歡迎致電艾鍗學院 (02)2316-7736

立即報名

免費課程諮詢 0 元 2018/08/02 00:00 ~ 2018/09/30 00:00 報名截止

本課程由 itc9988 發佈

課程問答

我要提問

對課程有任何問題,都歡迎在這裡向開課單位提問

相關課程

0 人收藏
0 人收藏