學習目標和取得技能
- 認識Google Cloud Platform 中主要大數據和機器學習工具之使用目的和價值
- 使用Cloud SQL 和Cloud Dataproc 將現有的MySQL 和Hadoop / Pig / Spark/ Hive 工作負載遷移到Google Cloud Platform
- 使用BigQuery 和Cloud Datalab 進行交互式數據分析
- 以TensorFlow 來訓練和操作神經網絡
- 操作各項簡易上手的ML API
- 自Google Cloud Platform 眾多數據處理產品中選擇適當工具協助處理任務
教學方式
Google認證講師課堂中文指導
教材與實驗
Google原廠教材與Qwiklabs實驗室
課程適合對象
- 數據分析師,數據科學家,商業分析師等,初接觸GCP 的使用者
- 負責設計數據處理的流程和架構、創建和維護機器學習及統計模型的人員;操作和查詢數據集、將查詢結果視覺化和創建數據分析報告的人員
- 管理階層和IT 決策者等,正在評估導入GCP 以供企業內數據科學家使用者
前備知識
- 熟悉常用資料庫,如SQL 的基礎語法
- 曾有數據建模、提取、轉換,和加載數據運行的經驗
- 可使用Python 等程式語言開發應用程序
- 熟悉機器學習和/或統計
課程大綱
課程包括課堂講解,演示和學員實作實驗
Module 1:介紹Google Cloud Platform
主題 | 實驗 |
Google 平台基礎知識概述 | -- |
Google 雲端平台大數據產品 | -- |
Module 2:計算和存儲基礎
主題 | 實驗 |
Compute Engine 可彈性擴充的高效VM (CPUs) | -- |
Cloud Storage 搭載全球邊緣快取技術的 物件儲存空間 | -- |
CloudShell 適用任何瀏覽器的指令列管理功能 | Set up a Ingest-Transform-Publish data processing pipeline |
Module 3:雲上的數據分析
主題 | 實驗 |
簡介雲上的數據分析 | -- |
Cloud SQL:雲上的SQL 數據庫 | Importing data into CloudSQL and running queries |
Spark on Dataproc 代管服務 | Machine Learning Recommendations with Spark on Dataproc |
Module 4:擴充數據分析功能
主題 | 實驗 |
快速隨機訪問 | -- |
探索、分析並以視覺化方式呈現大型資料集的Datalab | -- |
內建機器學習技術的全代管資料倉儲服務,且具高擴充性的BigQuery | Build machine learning dataset |
Module 5:機器學習
主題 | 實驗 |
TensorFlow 與機器學習 | Carry out ML with TensorFlow |
針對常見需求預建的可用模型 | Employ ML APIs |
Module 6:數據處理架構
主題 | 實驗 |
Pub / Sub 訊息導向的事件串流架構 | -- |
使用Dataflow 創建數據處理管道 | -- |
即時和批量數據處理的架構 | -- |
Module 7:總結
主題 | 實驗 |
為何選擇GCP | -- |
下㇐步行動 | -- |
其他資源 | -- |


