請問抓取日報表資料被證劵停止的問題
請問各位大大我使用這個網址的程式抓取日報表時http://www.coco-in.net/thread-19432-1-1.html
都會被證交所停止
只抓到一兩百個
請問該怎麼解決呢??
大概是證交所網站有檢查, 如果太頻繁連線, 就暫時中斷連線吧. 簡單的解決方法, 放慢速度..
下載下面這個檔案, 解壓縮覆蓋掉原來的檔案, 再執行試看看.. (Sorry! pythonist 大, 沒有經過您的同意就擅自修改您的檔案, 如有冒犯, 請見諒.)
補充說明.. 其實我只加二行到原來的程式.. 但因為 Python 的程式碼有嚴格限制該不該空格, 以及空幾格, 空白和 Tab 不能混用.. 怕有人不會改, 所以上面我直接附上改好的程式檔案..
如果不放心我改的, 或者想自己改... 方法如下:
1. 在第 14 行 import urllib2 這行的下面新增下面這行.. ( import 前面不要有空格)
import time
2. 在第 129 行 stuff(]) 下面新增下面這行.. (time 前面要有 12 空白字元, 對齊 stuff 的第一個字, 不要用 tab.).. 括號裡的數字是要停幾秒.. 我剛用 1 已經完整執行完畢. 萬一 1 還不行, 試著用大一點的數字, 但不要太大, 程式會跑很久.
time.sleep(1)
感謝sdnian大~
目前正在下載中~ㄏㄏ
頁:
[1]