用Python 抓取期交所/證交所的盤後資料
最近在練習用Python 抓取期交所/證交所的盤後資料, 並且整理後放在網頁上讓自己參考.如附圖:
網址為: hxxp://webstkinfo.haostudio.net/stkinfo/
但是遇到一個瓶頸, 就是若要抓取個股的卷商買賣資訊時, 需要輸入驗證碼, 但是程式如何去判斷驗證碼為何呢? 有人知道應該如何做嗎? 或者是能提供一個解決的方向嗎?
圖片處理與文字辨識,試試
Pillow
Tesseract
另外提醒抓大量資料中間最好做個暫停 感謝 Sirius 大大,我找機會來試試看
頁:
[1]