COCO研究院

 找回密碼
 註冊
搜索
查看: 4771|回復: 9

[求檔] 請問權證的買賣日報表怎樣抓呢?

[複製鏈接]
發表於 14-10-11 05:13 | 顯示全部樓層 |閱讀模式
各位好,

想詢問一下,目前上櫃有抓取時間的限制,也就是說不能頻繁密集的抓取數據,不然會被判讀為攻擊而擋掉
因此,想問一下權證那麼多檔,如果設定幾秒才又再去抓取,這樣不就要抓到天荒地老嗎?
不曉得有沒有版面的先進針對這塊怎樣抓取的部分,可以提供建議嗎? 謝謝!
發表於 14-10-11 06:58 | 顯示全部樓層
應該不是會被判讀為攻擊而擋掉
而是會被判讀為使用程式自動下載而擋掉
它目的其實是要防堵自動抓取的程式
 樓主| 發表於 14-10-11 08:21 | 顯示全部樓層
那版面上的高手們,要抓權證資料也是抓一檔在隔一些時間再抓下一檔嗎?
發表於 14-10-11 09:16 | 顯示全部樓層
請問一下權證的買賣日報表在哪下載?
發表於 14-10-11 19:42 | 顯示全部樓層
本帖最後由 wcyjulian 於 14-10-11 19:43 編輯
Sirius 發表於 14-10-11 09:16
請問一下權證的買賣日報表在哪下載?

集中市場
http冒號//www點twse點com點tw/ch/stock_search/warrant_search.php?STK_NO=2330
OTC
http冒號//www點otc點org點tw/web/extend/warrant/warrant_search_01_result.php?l=zh-tw&warrantobject=1785

把後面那個股票代號換掉, 就可以用Python 這些程式掛系統定時去抓, 證交所用的是html, OTC比較特別, 用的是json格式
發表於 14-10-11 20:38 | 顯示全部樓層
權證買賣日報表抓取方式跟
http://www.coco-in.net/thread-19432-1-11.html
的方法一樣。

以上市證券為標的的權證就在
http://bsr.twse.com.tw/bshtm/
輸入權證代號如  081987
就可抓到  4M凱基  的買賣日報表。

以上櫃證券為標的的權證就在
http://www.gretai.org.tw/web/stock/aftertrading/broker_trading/brokerBS.php
輸入權證代號如  715337
就可抓到  Z6群益  的買賣日報表。

程式中適時的delay和try-exception-backoff-retry可以在2小時內抓完6仟多個檔案。
發表於 14-10-13 11:43 | 顯示全部樓層
請問http://www.coco-in.net/thread-19432-1-11.html
要怎樣改才能一起抓到權證呢
發表於 14-10-13 21:08 | 顯示全部樓層

根據
http://www.twse.com.tw/web_mng/manage_content/manage_content_list_download.php?listId=info_exchange_03_2&itemId=1142819996_80

       
                               
                               
                               
                               
                               
國內標的認購權證
030000-089999
國內標的認購權證(不等比)
030000-089999
國內標的認售權證
03000-08999+第六碼P
國內標的認售權證(不等比)
03000-08999+第六碼P
外國標的認購權證
03000-08999+第六碼F
外國標的認購權證(不等比)
03000-08999+第六碼F
外國標的認售權證
03000-08999+第六碼Q
外國標的認售權證(不等比)
03000-08999+第六碼Q
下限型認購權證
03000-08999+第六碼C
下限型認購權證(不等比)
03000-08999+第六碼C
上限型認售權證
03000-08999+第六碼B
上限型認售權證(不等比)
03000-08999+第六碼B


       
                               
                               
                               
                               
                               
國內標的認購權證
700000-739999
國內標的認購權證(不等比)
700000-739999
國內標的認售權證
70000-73999+第六碼P
國內標的認售權證(不等比)
70000-73999+第六碼P
外國標的認購權證
70000-73999+第六碼F
外國標的認購權證(不等比)
70000-73999+第六碼F
外國標的認售權證
70000-73999+第六碼Q
外國標的認售權證(不等比)
70000-73999+第六碼Q
下限型認購權證
70000-73999+第六碼C
下限型認購權證(不等比)
70000-73999+第六碼C
上限型認售權證
70000-73999+第六碼B
上限型認售權證(不等比)
70000-73999+第六碼B




如果只想抓權證,改一行就可以了。
idfilter = re.compile(r'^(?:0[3-8]|7[0-3])\d{3}[\dPFQCB]$')

評分

參與人數 1金錢 +2 收起 理由
0sman + 2

查看全部評分

發表於 14-10-14 08:40 | 顯示全部樓層
感謝
原來是idfilter
我一直改後面數字 果然沒這麼簡單
發表於 14-10-15 14:15 | 顯示全部樓層
請問大家最近有遇到無法一次抓到全部的明細嗎
檔案數也都不一樣
您需要登錄後才可以回帖 登錄 | 註冊

本版積分規則

手機版|Archiver|站長信箱|廣告洽詢|COCO研究院

GMT+8, 24-12-2 18:39

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回復 返回頂部 返回列表
理財討論網站 |