COCO研究院

 找回密碼
 註冊
搜索
查看: 6739|回復: 7

如何自動下載台灣加權指數?

[複製鏈接]
發表於 13-6-14 07:08 | 顯示全部樓層 |閱讀模式

如何自動下載台灣加權指數?
我查到證交所的網頁是
http://www.twse.com.tw/ch/trading/indices/MI_5MINS_HIST/MI_5MINS_HIST.php
有個下載CSV的按鈕,可是不知道這個按鈕的直接連結是什麼?
想用 wget自動抓
Thanks

發表於 13-6-14 08:53 | 顯示全部樓層
本頁隱藏在HTML(<input type=hidden id='html' name='html' value="數據內容")
那種把加權指數用隱藏在HTML轉存CSV
CSV按鈕的直接連結就是用前一個的隱藏在HTML網頁輸入CSV格式
 樓主| 發表於 13-6-14 09:09 | 顯示全部樓層
感謝goldsuper7的提點,但是不懂耶,那答案是什麼?
發表於 13-6-14 09:10 | 顯示全部樓層
早期用的每分鐘自動化抓取271點交易數據
民國100年1月16日以前 每一分鐘方式提供早期得
目前要用每15秒自動化機器人抓取即時的取1081點交易數據
自動化程式抓當日即時開盤指數 及盤中的高指數跟最低指數 最後的收盤指數
發表於 13-6-14 10:32 | 顯示全部樓層
我會用以下這段程式把它找出來

For Each t In IE.document.getElementsByTagName("input")
            If Trim(t.Value) = "查詢" And t.Type = "button" Then
                Set button_object = t
                Exit For
            End If
Next

評分

參與人數 1金錢 +1 收起 理由
lwhuang + 1 不懂耶,可否再詳細點

查看全部評分

發表於 13-6-14 11:59 | 顯示全部樓層
這個網頁的資料擷取,建議直接解析網頁了

因這個網頁的作法有點繁鎖
它把資料包在form中,再用另一JavaScript處理
故無法直接取得該資料

晚點另補2個圖做說明,剛上傳圖片出錯
發表於 13-6-14 17:28 | 顯示全部樓層
除了在網頁上看到的表格資料,另一份重複資料被暗藏在一個 id 為 data_form 的表單中,如紅框所示
底下反白成藍色的部份,就是點「另存csv」要做的動作,它調用exportReportData()

重複資料

重複資料



exportReportData()在外部的JavaScript檔中,它把data_form表單的資料再送回後端伺服器處理,再從伺服器傳回.csv檔

JavaScript

JavaScript


該站上許多網頁程式都像上述脫褲子放屁的作法,包裝重複資料,要.csv檔時,再把已經在使用者機器中的資料傳回伺服器,處理完再傳回.csv檔。
小量資料傳來傳去還不打緊,有些大量資料(像當日全部個股及權證資料)這樣傳來傳去,不僅效率不好,也多耗網路頻寬,也增加伺服器負荷

若要用wget的方式取回.csv檔,也必須抓出這段暗藏的資料,倒不如直接解析網頁上那個資料表格,反而會省事些

評分

參與人數 3金錢 +6 收起 理由
heavenweaver + 2 太強了
joey0415 + 2 太強了
lwhuang + 2 太強了,感謝!想到parse html就...懶了.

查看全部評分

發表於 13-6-18 11:34 | 顯示全部樓層
有興趣可參考一下這篇:利用 Python 抓取資料導入 AB

評分

參與人數 2金錢 +4 收起 理由
joey0415 + 2 按一個讚
lwhuang + 2 感謝分享

查看全部評分

您需要登錄後才可以回帖 登錄 | 註冊

本版積分規則

手機版|Archiver|站長信箱|廣告洽詢|COCO研究院

GMT+8, 24-12-2 20:03

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回復 返回頂部 返回列表
理財討論網站 |