felix2010 發表於 12-11-26 20:25

請問抓取日報表資料被證劵停止的問題

請問各位大大我使用這個網址的程式抓取日報表時
http://www.coco-in.net/thread-19432-1-1.html

都會被證交所停止
只抓到一兩百個
請問該怎麼解決呢??

sdnian 發表於 12-11-26 21:19

大概是證交所網站有檢查, 如果太頻繁連線, 就暫時中斷連線吧. 簡單的解決方法, 放慢速度..

下載下面這個檔案, 解壓縮覆蓋掉原來的檔案, 再執行試看看.. (Sorry! pythonist 大, 沒有經過您的同意就擅自修改您的檔案, 如有冒犯, 請見諒.)

sdnian 發表於 12-11-26 21:35

補充說明.. 其實我只加二行到原來的程式.. 但因為 Python 的程式碼有嚴格限制該不該空格, 以及空幾格, 空白和 Tab 不能混用.. 怕有人不會改, 所以上面我直接附上改好的程式檔案..

如果不放心我改的, 或者想自己改... 方法如下:

1. 在第 14 行 import urllib2 這行的下面新增下面這行.. ( import 前面不要有空格)

import time

2. 在第 129 行 stuff(]) 下面新增下面這行.. (time 前面要有 12 空白字元, 對齊 stuff 的第一個字, 不要用 tab.).. 括號裡的數字是要停幾秒.. 我剛用 1 已經完整執行完畢. 萬一 1 還不行, 試著用大一點的數字, 但不要太大, 程式會跑很久.

time.sleep(1)

felix2010 發表於 12-11-26 22:59

感謝sdnian大~
目前正在下載中~ㄏㄏ
頁: [1]
查看完整版本: 請問抓取日報表資料被證劵停止的問題