■ 活動介紹
🧐 你是否在學完基礎爬蟲後,發現在爬取特定網站時,有些資料還是爬取不到
🧐 如果短時間爬取大量的網頁資料,會對網站有什麼影響呢
資料爬蟲是資料分析的起手式,必須有好的、可用的資料才得以進行高品質的資料科學專案,爬蟲也是資料科學領域開發者的第一項挑戰。但是當你學完爬蟲的技術之後,開始真的跳入爬蟲世界之後會發現有網站其實沒有想像中好爬。當自動化的爬蟲技術越來越廣泛應用的同時,網站方也有一些「反爬蟲」的機制出現,讓開發者無法輕易的爬蟲所需的資料。這場免費直播想跟大家分享的是當你的爬蟲程式又被擋了怎麼辦?常見的反爬蟲知識以及對應的克服反爬蟲處理策略有哪些。這場直播活動將解決多數人對網路爬蟲的疑惑,更教你應付反爬蟲機制。直播 4 大精彩內容,一解你的疑惑:
① 什麼是惡意爬蟲?爬蟲對網站的影響
② 現代網站運作的溝通與架構
③ 常見的反爬蟲與克服反爬蟲的處理策略
④ 進階爬蟲世界的學習地圖
■ 時間與活動方式
* 時間:2021/10/07 (四) 20:00 - 21:00
* 地點:Facebook 線上直播
■ 講者資訊
➤ 張維元 | 資料科學與網站開發雙棲工程師
擅長網站開發與資料科學的雙棲工程師,斜槓於程式社群 【JSDC】核心成員及 【資料科學家的工作日常】粉專經營。目前在 ALPHACamp 擔任資料工程師,同時也在中華電信、工研院與多所學校等單位持續開課。擁有多次國內大型技術會議講者與競賽獲獎經驗,曾獲得 2018 台灣總統盃黑客松 冠軍隊伍與 2016 微軟 Imagine Cup 台灣區冠軍,持續在不同的平台發表對 #資料科學、 #網頁開發 或 #軟體職涯 相關的分享。




