|
由於原帖無法回覆,使用喧囂卡也無效,只好另開新帖回答。
使用上的問題:
1. 太早抓,像在下午三點多就開始抓,有些股票資料還沒更新,就會漏掉。
2. 太多人同一時間抓,證交所有流量管制,會回傳空資料或直接斷線。
3. 網路環境爛,latency太長。
解決方法(不用修改程式):
1. 用穩定的光纖、ADSL或Cable Modem網路,並在晚上八、九點以後抓。
解決方法(需要修改程式):
1. 改程式,加入連線失敗後重新連線程式。可以寫一個retry decorator將連線部份的程式包裝起來,在連線發生Exception時做backoff後重連。Google查詢"python retry decorator"可看到很多參考資料。
2. 如果剛好有wget可以用,可以將Exception->Backoff->Retry的工作offload給wget。在Python可以用
subprocess.call(['wget', '-O', 'temp.html', '-nv', '-t', '120', '--waitretry=300', '-r', '-l', '1', '--no-parent', '--no-cache', '--post-data', postdata, link])
|
評分
-
查看全部評分
|