課程介紹
隨著巨量時代的到來,資料分析與探勘成為科技顯學,各行各業對於大數據的濃厚興趣也直接反映在大數據人才的豐厚薪資中。「資料分析師」指的是不同行業中,專門從事行內數據蒐集、整理、分析,並依據這些數據做出研究、評估的專業人員。本課程選擇以Python程式語言教學,帶領您從零基礎開始,一步步進入資料分析的專業領域。
課程對象
大專畢業,對從事巨量資料分析與程式開發工作有興趣者。
培訓證書發放準則
參訓學員出席率達80%且通過考試,工研院產業學院頒發「Python AI人工智慧資料分析師」培訓證書。
學習大綱
單元一:Python網路爬蟲實作技術 Python程式設計入門
Python程式語言比C或Java語言更容易學習,語法簡易功能強大,有高效的內建資料結構及優雅的語法,其優質的設計架構及豐富的程式套件更讓Python在許多領域廣泛應用。此外,Python也可在Linux, MAC, Windows, Android, 與iOS等平台上執行。 Python在網路爬蟲、數據處理、與雲端基礎設施等領域都有大量運用,是您學習數據資料分析不可或缺的工具。
| 主題 | 內容 | |
| Python簡介 | ▪ 程式語言發展 ▪ 編譯器與直譯器 ▪ Python 語言特性與禪思 ▪ Python 的應用 ▪ 設定開發環境 | ▪ 安裝套件 ▪ 整合式開發環境 ▪ 程式基本要素 ▪ 陳述與表示式 ▪ 輸出指令與註解 |
| 資料與模組 | ▪ 資料值與資料型態 ▪ 字串 ▪ 資料型態轉換 | ▪ 變數 ▪ 運算子與運算元 ▪ Python 模組 |
| 資料結構 | ▪ Python 型態 ▪ 字串與字串方法 ▪ 串列與串列方法 | ▪ 字組 ▪ 字典 |
| 決策迴圈與函式 | ▪ 複合指令 ▪ 布林值與布林表示式 ▪ 決策 ▪ For 迴圈 ▪ While 迴圈 | ▪ 檔案處理 ▪ 例外處理 ▪ 函式 ▪ 函式的回覆值與執行流程 ▪ 函式的參數與變數 |
| 物件與類別 | ▪ 物件簡介 ▪ 類別 ▪ 物件的產生 | ▪ 程序式與物件導向式設計的比較 ▪ 物件導向程式設計範例 |
單元二:Python網路爬蟲實作技術
處理大數據的目標使效率越來越高,成本不斷減少,從而造就了基於大數據的商業智能。而網際網路大量的資料等待著挖掘與分析,如何取得正確與精準的資料,網路爬蟲技術是一項非常實用的技能。這堂課深入淺出地教您如何打造自己的網頁爬蟲,透過實際的範例練習,讓您了解基礎的網頁爬蟲實戰技術。
| 主題 | 內容 |
| 資料來源與取得 | ▪ 介紹公開的資料來源與如何使用 Python 存取資料 ▪ 所需套件與環境準備 ▪ API 資料來源與 Request 串接存取 |
| 認識 HTTP 網站架構與資料溝通方式 | ▪ 介紹目前網站前後端架構 ▪ 網頁結構的解析與拆解 |
| 資料爬蟲 - 靜態網頁篇 | ▪ 使用 Request 與 Beatifulsoup 套件進行靜態網頁的爬蟲教學 ▪ 運用正規表示式有效率的整理資料 |
| 靜態網頁爬蟲實戰 | ▪ 實機操作 |
| 資料爬蟲 - 動態網頁篇 | ▪ 使用 Selenium 與 PhantomJS 套件進行動態網頁的爬蟲教學 |
| 動態網頁爬蟲實戰 | ▪ 實機操作 |
| 實務上的爬蟲應用 | ▪ 爬蟲被擋了怎麼辦?淺談常見防爬蟲機制與處理策略 ▪ 如何建構一個可以自動持續更新的爬蟲程式 |
| 有了資料之後,然後呢? | ▪ 資料儲存與管理(CSV、EXCEL、SQL) ▪ 介紹 Python 的資料科學生態系 ▪ 初探視覺化與資料探索 |
單元三:Python資料分析入門及工具運用
隨著科技的進步,透過寫程式的過程,可以做的事情越來越多。「會寫程式」這件事,好像變得跟「會說英文」一樣重要。本課程選擇的程式語言是Python,理論搭配實作教學,讓您能夠理解數據分析的基本概念與技巧,將所學運用在您的專業領域。
| 主題 | 內容 |
| 資料科學及Python工具 | ▪ 資料科學簡介及應用 ▪ 資料科學實作流程 ▪ Python3 語法快速簡介 |
| Numpy簡介 | ▪ NumPy Arrays ▪ NumPy 數值運算 ▪ NumPy 切片與串接 |
| Matplotlib與視覺化 | ▪ 折線圖(Line plot)▪ 散佈圖(Scatter plot) ▪ 直方圖(Histogram) ▪ 長條圖(Bar plot) ▪ 箱形圖(Box plot) |
| Pandas與資料處理 | ▪ 基本資料結構 ▪ 資料篩選 ▪ 資料匯入與匯出:Excel、CSV、JSON ▪ 遺失值處理 ▪ 資料合併、JOIN |
| Scikit-learn與機器學習 | ▪ 線性迴歸 * 分類-Logistic迴歸 * 分類-kNN(k-Nearest Neighbors) * 分類-SVM(Support Vector Machines) * 分類-Perceptron * 分群-KMeans(k-Means Clustering) |
單元四:機器學習理論與實作
AI已經進入到不同產業,不論在電子、金融、資訊、醫療、零售、通訊、交通、物流等領域,您都可能透過機器學習(Machine Learning)解決過去難以解決的問題。機器學習是人工智慧的其中一個分支,是一門很深的學問,本課程從基礎切入,由淺入深,包含理論及實作技術,讓學習者了解何時可以使用機器學習、為何機器可以學習、機器怎麼學習、如何讓機器學得更好,幫助您掌握機器學習最核心的觀念與技術本質。
| 主題 | 內容 |
| Introduction to Machine Learning | 1. 何謂機器學習? 2. 機器學習的核心與框架 3. 機器學習的種類? 監督式學習? 非監督式學習? 強化學習? 4. 為什麼要分訓練資料集與測試資料集? 5. 模型複雜度與資料複雜度 |
| Machine Learning I: Regression & Classification | 機器學習實作是以Scikit Learn為主 1. 以線性迴歸 (Linear Regression)為出發點 2. 帶你深入淺出迴歸模型與分類問題 (Classification) -Linear binary classification -羅吉斯迴歸(Logistic Regression) -支持向量機(Support Vector Machine) -Kernel method 3. 評估機器學習模型的學習效果 -損失函數(Loss Function) -均方根誤差(RMSE) -梯度下降法(Gradient Descent) -如何縮小RMSE? 模型與參數的選擇 4. 判斷模型預測能力的指標 -混淆矩陣、準確率 (Accuracy)、精準度(Precison)、召回率(Recall)、F -分數 (F-Score)、ROC曲線、AUC |
| Machine Learning II: Model evaluation | 1. 什麼是Overfitting? 2. 如何避免 Overfitting?ロRegularization 技巧 3. 如何挑選好的模型?ロ交叉驗證法(Cross Validation) |
| Machine Learning III: Clustering | 1.分群 (Clustering) -K-means -K-medoids -最大期望算法 -Hierarchical clustering -DBSCAN -Affinity propagation |
| Machine Learning IV: Ensemble learning | 1.Boosting 2.Bagging 3.決策樹 (Decision tree) 4.剪枝演算法 5.隨機森林 (Random forest) |
| Machine Learning V: Feature engineering & Dimensional reduction | 1.教你特徵工程的應用技術: -遺失值處理 -特徵縮放、轉換、建構、組合、萃取 2.降維演算法與應用: -PCA -MDS -tSNE |
課程用品:需自備筆電
課程洽詢: 04-25678652林小姐
注意事項 :
1. 為確保您的上課權益,報名後若未收到任何回覆,敬請來電洽詢方完成報名。
2. 因課前教材、講義及餐點之準備及需為您處理相關事宜,若您繳費後不克前來,請於開課三日前
打電話或MAIL告知,主辦單位將退還80%課程費用,一旦開課,恕不退費。
3. 若原報名者因故不克參加,但欲更換他人參加,敬請於開課前二日通知。





