COCO研究院

 找回密碼
 註冊
搜索
查看: 6907|回復: 20

下載一般交易買賣日報表 CSV

[複製鏈接]
發表於 14-11-19 13:44 | 顯示全部樓層 |閱讀模式
12月開始,證交所就要實施驗証碼程序
我想請問各位前輩們
驗証碼程序能否由程式辨視
我想付費請人幫忙寫這個下載程式


若有意願可與我連絡


或是還有那些管道可得到這個資訊(證券商會有賣嗎)


感謝各位前輩們

發表於 14-11-19 15:08 | 顯示全部樓層
請問您從哪裡得知的 ?
 樓主| 發表於 14-11-19 15:15 | 顯示全部樓層
證交所有公告            
發表於 14-11-19 15:25 | 顯示全部樓層
看到了  

你有圖形的 sample嗎

及早準備  不然到時候一定開天窗
 樓主| 發表於 14-11-19 15:34 | 顯示全部樓層
bsr.twse.com.tw/bshtm/
點選左側最下方<下載CSV>
就可看見了
發表於 14-11-20 02:27 | 顯示全部樓層
我大概找到解決辦法了

關鍵字 ocr  

現在他這類圖形辨識率  約70% 吧...

評分

參與人數 1金錢 +2 收起 理由
AGWZ + 2 太強了

查看全部評分

發表於 14-11-20 09:17 | 顯示全部樓層
由程式辨識是可行的
說不定會大改版
趁這幾天用下載csv練習一下吧

未命名.JPG


發表於 14-11-20 10:53 | 顯示全部樓層
請問是用Tesseract-OCR,或是還有其它推薦的軟體?
 樓主| 發表於 14-11-20 14:28 | 顯示全部樓層
yet3456788 好強
不知是否能向你買這個程式?
發表於 14-11-21 18:25 | 顯示全部樓層
終於......搞定了.....

現在可以放心了....

雖然辨識率不高  不到50%

但終於是能動了....   

192.168.1.5 phpocr example.php stockid=2474.png

評分

參與人數 1金錢 +2 收起 理由
AGWZ + 2 太強了

查看全部評分

發表於 14-11-22 01:03 | 顯示全部樓層
kidbaby 發表於 14-11-21 18:25
終於......搞定了.....

現在可以放心了....

kidbaby大大您好,

請問方便請您分享自動下載的這一段嗎?
或是跟您合作這部份

我自己這兩天針對辨識的部份寫了程式
正確率應該可達九成以上
但在輸入完POST回Server後雖可取得csv
但在最後存檔的動作無法做到自動化
不曉得是否可跟您一起合作完成?

圖1是辨識失敗的案例
有X表示我自己做的字典檔辨識失敗
第5位數在此也是判斷錯誤
1.jpg

圖2是辨識成功的案例
大部份應該都可辨識成功
2.jpg

Demo程式在這邊
需有.Net Framework 2.0
Demo.zip (160.12 KB, 下載次數: 374)

發表於 14-11-22 01:36 | 顯示全部樓層
randloop 發表於 14-11-22 01:03
kidbaby大大您好,

請問方便請您分享自動下載的這一段嗎?

這個紅字 此資料不得逕自散布或販售,並請詳閱「使用條款」

以前就有了嗎

還是最近才出現的 ?


發表於 14-11-22 10:54 | 顯示全部樓層
randloop 您好

我不太懂您的意思  您都可以看到csv了  還不能存檔...?

我的意思是 難的辨識部分你都可以克服了... 但無法存檔..?

怪怪的...


不講辨識的部分  當您按下下載的按鈕之後
他有繞了一下才開始下載
這個你要trace他網頁就能看到
你應該是在問這問題....   

不過您的圖形辨識度算是不錯的
我的好像還是差了一點


發表於 14-11-22 10:55 | 顯示全部樓層
saucer 發表於 14-11-22 01:36
這個紅字 此資料不得逕自散布或販售,並請詳閱「使用條款」

以前就有了嗎

這是想要打擊誰.......   

公開資訊不能散布...?
發表於 14-11-22 11:15 | 顯示全部樓層
本帖最後由 randloop 於 14-11-22 11:17 編輯
kidbaby 發表於 14-11-22 10:54
randloop 您好

我不太懂您的意思  您都可以看到csv了  還不能存檔...?

大大您好

不好意思 我指的並非不能存檔
而是存檔這個動作目前我沒辦法做成自動化,只能手動

我再放一版新的說明
Demo_S.zip (192.68 KB, 下載次數: 351)


圖1,按下載
1.jpg
註: 這個下載其實也可以不用按,我下面圖2直接按button1即會同按點到它了


圖2,我目前必須再做一顆按鈕去按它
此時它會跳出存檔的對話方塊
目前就是這一段我卡住,無法自動化
2.jpg


因為我試過抓它的Response Content其實是空白的
這段存檔不知道如何自動化??




另外關於辨識,我其實花了一些時間建立字典檔
字典檔建得越多,辨識率會越高
我打算克服上述問題後再多建立更大量的字典檔
到時成功率應該還可以更高




您需要登錄後才可以回帖 登錄 | 註冊

本版積分規則

手機版|Archiver|站長信箱|廣告洽詢|COCO研究院

GMT+8, 24-12-23 00:17

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回復 返回頂部 返回列表
理財討論網站 |