COCO研究院

 找回密碼
 註冊
搜索
查看: 1976|回復: 3

請問抓取日報表資料被證劵停止的問題

[複製鏈接]
發表於 12-11-26 20:25 | 顯示全部樓層 |閱讀模式
請問各位大大我使用這個網址的程式抓取日報表時
http://www.coco-in.net/thread-19432-1-1.html

都會被證交所停止
只抓到一兩百個
請問該怎麼解決呢??

發表於 12-11-26 21:19 | 顯示全部樓層
大概是證交所網站有檢查, 如果太頻繁連線, 就暫時中斷連線吧. 簡單的解決方法, 放慢速度..

下載下面這個檔案, 解壓縮覆蓋掉原來的檔案, 再執行試看看.. (Sorry! pythonist 大, 沒有經過您的同意就擅自修改您的檔案, 如有冒犯, 請見諒.)

demo.7z (2.11 KB, 下載次數: 409)
發表於 12-11-26 21:35 | 顯示全部樓層
補充說明.. 其實我只加二行到原來的程式.. 但因為 Python 的程式碼有嚴格限制該不該空格, 以及空幾格, 空白和 Tab 不能混用.. 怕有人不會改, 所以上面我直接附上改好的程式檔案..

如果不放心我改的, 或者想自己改... 方法如下:

1. 在第 14 行 import urllib2 這行的下面新增下面這行.. ( import 前面不要有空格)

import time

2. 在第 129 行 stuff[1]([stuff[0]]) 下面新增下面這行.. (time 前面要有 12 空白字元, 對齊 stuff 的第一個字, 不要用 tab.).. 括號裡的數字是要停幾秒.. 我剛用 1 已經完整執行完畢. 萬一 1 還不行, 試著用大一點的數字, 但不要太大, 程式會跑很久.

time.sleep(1)
 樓主| 發表於 12-11-26 22:59 | 顯示全部樓層
感謝sdnian大~
目前正在下載中~ㄏㄏ
您需要登錄後才可以回帖 登錄 | 註冊

本版積分規則

手機版|Archiver|站長信箱|廣告洽詢|COCO研究院

GMT+8, 24-11-20 13:39

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回復 返回頂部 返回列表
理財討論網站 |