
- 本課程從網路爬蟲的基礎知識談起,包括靜態網頁爬蟲技術、動能網頁爬蟲技術、網站爬蟲框架,完整涵蓋各種進階爬蟲實用技術。透過大量的程式實作,逐步地為你建構網路爬蟲技術的實戰力,我們邀集了業界網路爬蟲領域的資料工程師,為您解答學習過程中的各種疑難雜症,扎實的學習內容讓您每天只要花一點時間,就可以完整地學會各種網路爬蟲技術。
- 為了讓學員在學習的路上不孤單,除了有專家陪伴外,《Python網路爬蟲實戰馬拉松》的共學社群,可以讓你找到志同道合的學習夥伴,在學習的路上一起努力。無論是線上討論、線下組織讀書會,或是邀請夥伴一起期末專題,都可在共學社群中完成。
- 機器學習的關鍵資源在於巨量資料,資料蒐集是 AI 應用的第一哩路,在 AI 的訓練模型與 BI 決策過程中更是需要大量的資料集。能善用「網路爬蟲」關鍵技術的人,將能更有效、完整、精確地獲取目標資訊,從網路自動化地收集海量資訊,為後續機器學習的資料集舖路。
- 網路爬蟲充滿許多挑戰與樂趣,我們想和你一起分享社群導向的學習方法,希望透過你的參與,一同優化你的學習曲線,讓你更有效地掌握網路爬蟲的各種技術,累積更多實務學習經驗。
- AI 學習馬拉松系列購買完成後,即可永久閱讀,不限閱讀次數,學習完成後還會頒發完賽證書。已累積共超過 8,800 多位學員參與,想要與專家與同好一起學習的朋友,這次要把握機會報名。本屆馬拉松除了有更多 AI 專家加入、原有教材再升級,提供更多延伸閱讀,幫你更有系統掌握 AI 知識。

- 大數據資料集是機器學習的關鍵基礎,現今在各種資訊大量充斥於網路,要能有系統地即時蒐集網路上不斷更新的資訊,網路爬蟲的技能是必不可少的,能掌握網路爬蟲技術才能蒐集到需要的資料,把所學的 AI 演算法應用於實際要解決的問題。
- 「 Python網路爬蟲實戰馬拉松 」專家陪跑計畫,整理了 40 個 Python 網路爬蟲的關鍵知識點與各種具有代表性的網站實戰案例,以自主學習加上翻轉教育的方式引導用戶學習,並輔以業界專家協助回答學員在學習過程中的疑難雜症,希望以社群學習的方式加速學員在學習網路爬蟲的速度與快速累積實戰基礎能力。

◤ 課程實作專題 ◢
①ETTODAY 靜態爬蟲實作練習
②PTT(批踢踢) 網路爬蟲實作練習
③Wiki 爬蟲實作練習
④Yahoo! 電影網頁實作練習
⑤金融資訊 網頁爬蟲實作練習
⑥Hahow 網站爬蟲實作練習
⑦東森新聞雲 動態網站爬蟲實作練習
⑧104人力銀行網站爬蟲實作練習
⑨期末綜合爬蟲實戰練習

- 本活動從爬蟲與網頁的基礎知識、靜態網頁與動態網頁的爬蟲技術,到Scrapy網站等級爬蟲框架與各種進階的爬蟲與反爬蟲技術,最後是整合所學的期末實務專題,共包括6大學習里程碑,能夠完成大部分學習任務的學員,我們相信你已經能掌握Python網路爬蟲的重要基礎知識與實戰能力。
◤ 6大學習里程碑 ◢
①爬蟲基礎知識
介紹基本的Http網路通訊原理與HTML內容格式,搭配程式自動化收集資料
②靜態網頁爬蟲技術
拆解靜態網頁的規格與原理,使用Python爬蟲解析HTML / CSS / Javascript並收集靜態網頁中特定的資料
③動態網頁爬蟲技術
以使用Selenium + BeautifulSoup 模擬瀏覽器執行動態網頁,解析收集各種動態網頁生成的特定資料,並學習用瀏灠器開發者工具解析網頁內容的特徵
④Scrapy 網站爬蟲框架
面對網站級別的多網頁爬蟲需求,學習用Scrapy建立爬蟲策略與爬蟲框架
⑤進階爬蟲技術
有許多網站並非完全公開,本章將教你如何使用爬蟲進階技巧克服反爬蟲網站、自動登入、驗證碼等障礙和如何加速大量網頁的爬蟲執行效率。
⑥期末實戰專題
由專家群設計針對業界實務需求為學員設計結訓專題,學員可將活動中學習的各種知識點應用於結訓專題,開發可應用於未來實務需要的爬蟲技術,在開發過程中遭遇問題時,可以詢問專家並尋求解答與討論,最終希望由學員親手完成該專題進而掌握知識原理與實作。



「 Python網路爬蟲實戰馬拉松 」專家陪跑計畫,由專家群規畫完整的關鍵知識點,以每天 1 小時的學習節奏為學員開啟知識探索地圖,加速你的基礎學習進度。
- 實務經驗傳承
學員們在課程中所遭遇的學習問題,專家都會盡力協助解答,並分享業界實務經驗。
- 網路爬蟲每日練習與期末專題實戰
本課程設置每日的實作練習和期末專題挑戰,由專家群特別精心規劃的程式實作專題,讓你結合先前所學的知識點,挑戰基礎與進階的專題目標,大幅增進應用的技巧。透過嘗試與修正的過程,並隨時與專家討論與詢問,進而完整地將知識與實作結合。
- 陪跑專家回答問題範圍不侷限於馬拉松課程,學員有與網路爬蟲相關的問題也歡迎加入討論。
- 學習不間斷,一次購買永久學習
本活動除了學習任務挑戰,學員在參與本活動後可永久使用本活動 VIP 共學論壇,與專家和同儕自主學習討論。討論不侷限於學習任務,只要與論壇主題相符即可自由交流。
- 本活動也很歡迎本身對網路爬蟲有研究熱情的專家們申請加入,一同創造更友善的AI學習環境 (詳情請洽主辦單位)。

- 能使用 Python 獨立完成網路爬蟲程式之撰寫與實務應用
- 掌握網站架構解析與觀察 Http Request / Response解析目標網站的資訊內容
- 能針對靜態網站與動態網站分別實作不同的網路爬蟲策略
- 實際完成真實網站的網路爬蟲挑戰與解決實際遭遇的爬蟲問題
- 使用爬蟲進階技術克服反爬蟲網站、自動登入、驗證碼等障礙和如何加速大量網頁的爬蟲執行效率

- 你在爬蟲馬拉松的學習紀錄與專題成果,將上傳至世界最大的開源碼平台 Github,你可以反覆練習與修改上傳的程式碼,提升對各知識點的掌握,而這些紀錄將為你未來的職涯發展與學習加分。



- 兼顧每位學員的學習需求
由於每位學員的背景和需求不同,在學習過程中遭遇的問題也有所差異。為了讓學員們能順利學習,掌握關鍵知識點,Cupoy 的 AI 專家群會盡力回答學員的提問,從主題觀念、request使用、網頁爬蟲實際案例教學、解題方法、文章拆解等,甚至實務開發的問題,專家都會盡力給你最適合的建議與解答。
- 學習不間斷,一次購買永久學習
本活動除了學習任務挑戰,學員在參與本活動後可永久使用本活動 VIP 共學論壇,與專家和同儕自主學習討論。討論不侷限於學習任務,只要與論壇主題相符即可自由交流。

- 共學社團:提供組織線上/線下共學社團功能,幫你輕易找到志同道合的學習夥伴。
- 與專家共學:與領域專家互動,學習該領域最實用的實作知識,幫助您快速累積產業實力。
- 共享知識:在共學社團中你可以分享,或取得其他成員所提供的即時 AI 知識,讓你洞悉產業應用的潮流趨勢。
- 本活動規畫的學習任務挑戰,學員可以將自己完成的程式上傳到 Github 並在共學論壇中分享,其它學員也可以參與論壇中的問題討論,透過專家與學習同儕的群眾智慧,一起克服在學習中的各種疑難雜症。

活動資訊
- 活動報名期間 即日起至 5/26
課程已經釋放,學員可隨時報名參加,無需等待其他學員一同開跑。
- 活動時程
Python資料科學程式馬拉松 ,學習期間約 60 天,永久閱讀。
- 活動費用
👉 單人票 $1,480 / 多人套票 $1,399 (人)
備註:(多人報名資料,請勿勾選所有票券均代入相同資訊)
- 學習保證
本活動的學員能永久使用 Cupoy 的 VIP 共學社群服務,隨時與專家群切磋討論 AI 問題,自由交流與觀摩其他學員作品與模型。
- 精彩教材試閱:(請使用電腦瀏覽)
💁♂ 爬蟲基礎介紹-資料來源與檔案存取
💁♂使用 Python 解析存取 CSV 與 XML 等檔案內容
- 學習方式
本活動以翻轉教育的方式為宗旨,參加者至活動官網上面閱讀教材、觀看題目,執行範例程式或作答思考題,最後完成作業。
在 VIP 專屬問答社區與專家互動交流,解題遇到困難可向專家直接提問,與同儕互相討論學習,活動結束後,您依然可以使用該問答社群與專家交流,詢問與本活動相關的其它實務面所遇到的問題。
提供範例程式碼與作業練習、期末專題、多元補充與推薦教材(影音/文章)等,方便您反覆溫習。
活動進行方式採線上進行,不會有實體授課,只要有網路的地方您都可以進行馬拉松的活動,也歡迎海外的朋友來報名,教材內容以繁體撰寫,某些推薦閱讀會提供英文網站與資源。
- 活動進度
活動時間為參考時間,您可隨時依照個人時程安排學習進度,達成馬拉松完成條件與期末專題指定目標,將頒發完賽證書。(建議在一年內完成,效果較佳)
- 參加資格
課程範例程式碼以 Python 語法為主。建議您在正式開始前能具備 Python 或其他程式語言初級以上的能力,或預習完成下列 Python 影片。 - 電腦設備
Windows/Mac/Linux系統,64位元版本
- 完成條件
- 完成全部題目
- 參與並完成期末專題指定目標,將頒發完賽證書。

【Marathon】無法每天花一小時上課,可以事後花時間上課學習嗎,作業有提交時間限制嗎?
參加活動前,請詳閱以下注意事項,以保障您的權益
- 參加規則
參加前請務必參照活動辦法提供的文件內容,註冊與下載需使用之軟體與平台。
- 取消參加
請於活動開始日期前 8 天開始前提出申請,因委託 Accupass 進行退費,配合 Accupass 退費方式,退款手續費 10% 由申請退款者自行吸收。
- 著作權
主辦單位活動題目內容之文字與圖檔、資料或原有衍生之智慧財產權,隸屬於主辦單位所有。
- 服務異動
主辦單位保留可更改活動內容之權利,由官網通知所有更新異動內容。
凡報名參加者,即視為同意本參加規則的各項規定,若有未盡事宜或不可抗力因素而有所異動,主辦單位保有變更內容之權利。
參加者於問答社區內所提問的問題,主辦單位將保留回覆問題時間與頻率異動之權利。
- 登入帳號
我們將預設您提供的電子信箱為活動的登入帳號,報名多人票券的朋友將是以各別提供的電子信箱登入,每個人都會有各自登入帳號 (不會使用到 Accupass 寄送的 QR Code)。
報名多人票券,僅有課程訂購人Email會收到由「Accupass」系統自動寄送訂單完成信,您與朋友將於課程上線時,收到由主辦單位分別寄送的課程活動通知信。
請於報名表內填寫發票資訊,發票若有問題,請於報名繳費後 7 日內以前提出,逾時不受理。
需開出統編發票的參加者,建議使用官網報名,可立即至「我的訂單」下載發票。
(官網連結:https://www.cupoy.com)若有任何問題歡迎來信 service@cupoy.com
聯絡電話:02-2558-0996
聯絡人:王小姐 聯絡時間:週一到週五 1000-1900








