- 機器學習的關鍵資源在於巨量資料,資料蒐集是 AI 應用的第一哩路,在 AI 的訓練模型與 BI 決策過程中更是需要大量的資料集。能善用「網路爬蟲」關鍵技術的人,將能更有效、完整、精確地獲取目標資訊,從網路自動化地收集海量資訊,為後續機器學習的資料集舖路。
- 本課程從網路爬蟲的基礎知識談起,包括靜態網頁爬蟲技術、動能網頁爬蟲技術、網站爬蟲框架,完整涵蓋各種進階爬蟲實用技術。透過大量的程式實作,逐步地為你建構網路爬蟲技術的實戰力,我們邀集了業界網路爬蟲領域的資料工程師,為您解答學習過程中的各種疑難雜症,扎實的學習內容讓您每天只要花一點時間,就可以完整地學會各種網路爬蟲技術。
- 為了讓學員在學習的路上不孤單,除了有專家陪伴外,《Python網路爬蟲實戰馬拉松》的共學社群,可以讓你找到志同道合的學習夥伴,在學習的路上一起努力。無論是線上討論、線下組織讀書會,或是邀請夥伴一起期末專題,都可在共學社群中完成。
- 網路爬蟲充滿許多挑戰與樂趣,我們想和你一起分享社群導向的學習方法,希望透過你的參與,一同優化你的學習曲線,讓你更有效地掌握網路爬蟲的各種技術,累積更多實務學習經驗。

- 大數據資料集是機器學習的關鍵基礎,現今在各種資訊大量充斥於網路,要能有系統地即時蒐集網路上不斷更新的資訊,網路爬蟲的技能是必不可少的,能掌握網路爬蟲技術才能蒐集到需要的資料,把所學的 AI 演算法應用於實際要解決的問題。
- 「 Python網路爬蟲實戰馬拉松 」專家陪跑計畫,整理了 40 個 Python 網路爬蟲的關鍵知識點與各種具有代表性的網站實戰案例,以自主學習加上翻轉教育的方式引導用戶學習,並輔以業界專家協助回答學員在學習過程中的疑難雜症,希望以社群學習的方式加速學員在學習網路爬蟲的速度與快速累積實戰基礎能力。

◤ 課程實作專題 ◢
1⃣ETTODAY 靜態爬蟲實作練習
2⃣PTT(批踢踢)網路爬蟲實作練習
3⃣Wiki爬蟲實作練習
4⃣Yahoo! 電影網頁實作練習
5⃣金融資訊網頁爬蟲實作練習
6⃣Hahow網站爬蟲實作練習
7⃣東森新聞雲網站爬蟲實作練習
8⃣104人力銀行網站爬蟲實作練習
9⃣期末綜合爬蟲實戰練習
- 本活動從爬蟲與網頁的基礎知識、靜態網頁與動態網頁的爬蟲技術,到Scrapy網站等級爬蟲框架與各種進階的爬蟲與反爬蟲技術,最後是整合所學的期末實務專題,共包括6大學習里程碑,能夠完成大部分學習任務的學員,我們相信你已經能掌握Python網路爬蟲的重要基礎知識與實戰能力。
◤ 6大學習里程碑 ◢
1⃣爬蟲基礎知識
介紹基本的Http網路通訊原理與HTML內容格式,搭配程式自動化收集資料
2⃣靜態網頁爬蟲技術
拆解靜態網頁的規格與原理,使用Python爬蟲解析HTML / CSS / Javascript並收集靜態網頁中特定的資料
3⃣動態網頁爬蟲技術
以使用Selenium + BeautifulSoup 模擬瀏覽器執行動態網頁,解析收集各種動態網頁生成的特定資料,並學習用瀏灠器開發者工具解析網頁內容的特徵
4⃣Scrapy 網站爬蟲框架
面對網站級別的多網頁爬蟲需求,學習用Scrapy建立爬蟲策略與爬蟲框架
5⃣進階爬蟲技術
有許多網站並非完全公開,本章將教你如何使用爬蟲進階技巧克服反爬蟲網站、自動登入、驗證碼等障礙和如何加速大量網頁的爬蟲執行效率。
6⃣期末實戰專題
由專家群設計針對業界實務需求為學員設計結訓專題,學員可將活動中學習的各種知識點應用於結訓專題,開發可應用於未來實務需要的爬蟲技術,在開發過程中遭遇問題時,可以詢問專家並尋求解答與討論,最終希望由學員親手完成該專題進而掌握知識原理與實作。


「 Python網路爬蟲實戰馬拉松 」專家陪跑計畫,由專家群規畫完整的關鍵知識點,以每天 1 小時的學習節奏為學員開啟知識探索地圖,加速你的基礎學習進度。
- 實務經驗傳承
學員們在課程中所遭遇的學習問題,專家都會盡力協助解答,並分享業界實務經驗。
- 網路爬蟲每日練習與期末專題實戰
本課程設置每日的實作練習和期末專題挑戰,由專家群特別精心規劃的程式實作專題,讓你結合先前所學的知識點,挑戰基礎與進階的專題目標,大幅增進應用的技巧。透過嘗試與修正的過程,並隨時與專家討論與詢問,進而完整地將知識與實作結合。
- 陪跑專家回答問題範圍不侷限於馬拉松課程,學員有與網路爬蟲相關的問題也歡迎加入討論。
- 學習不間斷,一次購買永久學習
本活動除了學習任務挑戰,學員在參與本活動後可永久使用本活動 VIP 共學論壇,與專家和同儕自主學習討論。討論不侷限於學習任務,只要與論壇主題相符即可自由交流。
- 本活動也很歡迎本身對網路爬蟲有研究熱情的專家們申請加入,一同創造更友善的AI學習環境 (詳情請洽主辦單位)。

- 能使用 Python 獨立完成網路爬蟲程式之撰寫與實務應用
- 掌握網站架構解析與觀察 Http Request / Response解析目標網站的資訊內容
- 能針對靜態網站與動態網站分別實作不同的網路爬蟲策略
- 實際完成真實網站的網路爬蟲挑戰與解決實際遭遇的爬蟲問題
- 使用爬蟲進階技術克服反爬蟲網站、自動登入、驗證碼等障礙和如何加速大量網頁的爬蟲執行效率



- 兼顧每位學員的學習需求
由於每位學員的背景和需求不同,在學習過程中遭遇的問題也有所差異。為了讓學員們能順利學習,掌握關鍵知識點,Cupoy 的 AI 專家群會盡力回答學員的提問,從主題觀念、request使用、網頁爬蟲實際案例教學、解題方法、文章拆解等,甚至實務開發的問題,專家都會盡力給你最適合的建議與解答。
- 學習不間斷,一次購買永久學習
本活動除了學習任務挑戰,學員在參與本活動後可永久使用本活動 VIP 共學論壇,與專家和同儕自主學習討論。討論不侷限於學習任務,只要與論壇主題相符即可自由交流。

- 共學社團:提供組織線上/線下共學社團功能,幫你輕易找到志同道合的學習夥伴。
- 與專家共學:與領域專家互動,學習該領域最實用的實作知識,幫助您快速累積產業實力。
- 共享知識:在共學社團中你可以分享,或取得其他成員所提供的即時 AI 知識,讓你洞悉產業應用的潮流趨勢。
- 本活動規畫的學習任務挑戰,學員可以將自己完成的程式上傳到 Github 並在共學論壇中分享,其它學員也可以參與論壇中的問題討論,透過專家與學習同儕的群眾智慧,一起克服在學習中的各種疑難雜症。

- 你在爬蟲馬拉松的學習紀錄與專題成果,將上傳至世界最大的開源碼平台 Github,你可以反覆練習與修改上傳的程式碼,提升對各知識點的掌握,而這些紀錄將為你未來的職涯發展與學習加分。

- 透過 Github 提交個人的學習紀錄與專題成果,讓其它人看見你的努力與堅持,未來幫助你在履歷和進修方面加分。


- 超過 5,500 位學員加入 AI 學習馬拉松,掌握去蕪存菁的學習資源,即刻優化個人 AI 的學習曲線。
活動資訊
活動開始時間:
「隨到隨跑,立即開始挑戰」,報名後您將在3個工作天內收到主辦單位寄送的活動通知信與會員啟動信,Accupass 填寫的電子信箱將預設為您的課程登入帳號,請參考通知信件說明啟動活動權限,即可開始學習。
權限開通後,一年內您可隨時依照個人時程安排學習進度,達成馬拉松完成條件與期末專題指定目標,將頒發完賽證書。
Cupoy活動官網連結
報名期限:
活動報名截止日期 2020/07/29 (額滿即提前停止售票)
學習保證:
本活動的學員能永久使用Cupoy的VIP共學社群服務(內含:每日領域新知 / 專家問答服務),隨時與專家切磋討論AI問題,自由交流與觀摩其他學員作品。目前學員超過 5,500人, AI 相關累積問答數已超過 2,200 則。點此查看
精彩教材試閱:(請使用電腦瀏覽)
💁♂ 爬蟲基礎介紹-資料來源與檔案存取
活動進度:
參加者可依照自己的學習狀況提交進度,毋須擔心時間過於緊湊,只要在活動結束後一年內完成,都能獲取完賽證明。
學習方式:
1. 本活動以翻轉教育的方式為宗旨,參加者至活動官網上面閱讀教材、觀看題目,執行範例程式或作答思考題,最後完成作業,在 VIP 專屬問答社區與專家互動交流,解題遇到困難可向專家直接提問,與同儕互相討論學習,活動結束後,您依然可以使用該問答社群與專家交流,詢問與本活動相關的其它實務面所遇到的問題。
2. 提供精美教材、範例程式碼與作業練習、期末專題、多元補充與推薦教材(影音/文章)等,方便您反覆溫習。
3. 活動進行方式採線上進行,不會有實體授課,只要有網路的地方您都可以參加百日馬拉松的活動,也歡迎海外的朋友來報名,教材內容以繁體撰寫,某些推薦閱讀會提供英文網站與資源。
登入帳號:
我們將預設您提供的電子信箱為活動的登入帳號,報名團體票券的朋友將以各別提供的電子信箱登入,每個人都會有各自登入帳號。(請注意:此活動為網路活動,不會使用到Accupass寄送的 QR Code)
參加資格:
課程範例程式碼以 Python 語法為主。建議您在正式開始前能具備 Python 或其他程式語言初級以上的能力,或預習完成下列 Python 影片。
1. 莫煩 Python3 基礎學 學習連結
2.彭彭老師 Python 入門教學 學習連結
電腦設備:
Windows/Mac/Linux系統,64位元版本
完成條件:
1. 完成全部題目
2. 參與並完成期末專題指定目標,將頒發完賽證書。

【Marathon】無法每天花一小時上課,可以事後花時間上課學習嗎,作業有提交時間限制嗎?
【Marathon】請問教材內容僅能在活動期間讀取及閱讀嗎? 還是能在活動結束後仍可以看這些資料呢?
【Marathon】課程是線上影音教學嗎?是在什麼平台呢? 社團能自由提問嗎?
活動注意事項
參加活動前,請詳閱以下注意事項,以保障您的權益
一、活動準備
參加前請務必註冊與安裝課程相關軟體與平台。
二、取消參加
退費申請:因委託 Accupass 進行退費,配合 Accupass 退費方式,欲取消參加,請於活動開始日期前 8 天開始前提出申請,最後申請時間為 07 月 20 日,退款手續費10%由申請退款者自行吸收。
三、著作權
1. 參賽者提交作業之著作權,歸屬參加者個人所有,但主辦單位共同擁有為推廣活動及教育目的重製、下載及公開展示等權利。
2. 主辦單位活動題目內容之文字與圖檔、資料或原有衍生之智慧財產權,隸屬於主辦單位所有。
四、服務異動
1. 主辦單位保留可更改活動內容之權利,由官網通知所有更新異動內容。
2. 凡報名參加者,即視為同意本參加規則的各項規定,若有未盡事宜或不可抗力因素而有所異動,主辦單位保有變更內容之權利。
3. 參加者於問答社區內所提問的問題,主辦單位將保留回覆問題時間與頻率異動之權利。
五、登入帳號
1. 我們將預設您提供的電子信箱為活動的登入帳號,報名團體票券的朋友將以各別提供的電子信箱登入,每個人都會有各自登入帳號。
2. 課程訂購人Email會收到由「Accupass」系統自動寄送訂單完成信,預計 3 個工作天會再寄送課程活動通知信至個別信箱。
若有任何問題歡迎來信 service@cupoy.com
聯絡電話:02-2558-0996
聯絡人:丁先生 聯絡時間:週一到週五 1000-1900












