Name	Name	Last commit message	Last commit date
Latest commit History 143 Commits
00_GET_POST	00_GET_POST
01_files_website	01_files_website
02_selenium	02_selenium
03_graph_api	03_graph_api
Session_A	Session_A
Session_B	Session_B
Session_C	Session_C
Session_D	Session_D
.gitignore	.gitignore
LICENSE	LICENSE
README.md	README.md

Name

Last commit message

Last commit date

143 Commits

Python 爬蟲實戰

下載程式與投影片

請於上課前下載好投影片與程式碼，程式碼可透過這個頁面右邊的 Clone or download 下載

課前準備: 安裝環境

Anaconda (建議)

下載 Python 3.6 版本 https://www.continuum.io/downloads
本課程會使用到瀏覽器 Chrome，麻煩各位選擇自己電腦的平台安裝 Chrome https://www.google.com.tw/chrome/browser/desktop/index.html
本課程的 Session A & B 將提供 .ipynb 檔案使用 jupyter notebook 進行，安裝完 Anaconda 後即可用內建 jupyter notebook 打開 .ipynb 檔，詳細教學可以參考資料夾中的 jupyter_notebook教學.pdf
本課程會用到的套件較多，建議安裝 Anaconda，如有安裝 Anaconda 只需安裝以下套件

$ pip install selenium tldextract Pillow

pip

pip 是 Python 的套件管理系統，在部份系統裏面會用 pip3 代表 Python3 的版本，請各位依照自己的系統安裝 pip3 後，安裝以下 Python3 版本的套件

# 視情況而定, 使用 pip 或是 pip3 $ pip install requests beautifulsoup4 lxml Pillow selenium tldextract

Optional: 資料分析

沒有練習題但會有範例 code 可以執行，可自行選擇是否安裝 (如果安裝 wordcloud 時有問題，可能是沒有下載 visual studio，可以從 warining 中提供的網址下載安裝)

# Anaconda $ pip install jieba wordcloud # pip $ pip3 install numpy pandas matplotlib scipy scikit-learn jieba wordcloud

請遵守別人的規則

有些網站會在目錄底下加上 robots.txt, 基本上這就是對方定義的爬蟲規則，請大家在練習爬蟲的時候要尊重對方的規則

robots.txt 詳細的語法與用途請參考 wiki 與 google 文件

Q&A

Q: 有哪些常用的 API

課堂中有說到，爬蟲只是一種得到資料的手段，如果對方有提供 API 就可以直接使用 API， API 通常對方都會幫你整理好資料格式，或是根據權限決定你可以獲取的資料內容

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Python 爬蟲實戰

下載程式與投影片

課前準備: 安裝環境

Anaconda (建議)

pip

Optional: 資料分析

請遵守別人的規則

Q&A

About

Uh oh!

Releases 1

Packages

Uh oh!

Contributors 3

Uh oh!

Languages

License

afunTW/Python-Crawling-Tutorial

Folders and files

Latest commit

History

Repository files navigation

Python 爬蟲實戰

下載程式與投影片

課前準備: 安裝環境

Anaconda (建議)

pip

Optional: 資料分析

請遵守別人的規則

Q&A

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Contributors 3

Uh oh!

Languages

Packages