COCO研究院

 找回密碼
 註冊
搜索
查看: 26512|回復: 1

台鐵時刻表(20140210起適用)(HTML版和PDF板)

[複製鏈接]
發表於 14-3-22 21:10 | 顯示全部樓層 |閱讀模式
高鐵有pdf格式的時刻表下載。台鐵只有xls格式的時刻表下載,而且還分散在25個xls檔案。於是用Python 2.7寫了一行程式將24個xls檔轉成1個html檔,以便無法上網時可以離線瀏覽。
  1. import re, subprocess, urllib; subprocess.call(['ssconvert', '--export-type=Gnumeric_html:html40frag', '-M', 'twrail.html'] + [filename for filename, _ in [urllib.urlretrieve(url, filename.decode('utf-8')) for url, filename in re.findall('"(http://.+20140210/(.+[.]xls))"', urllib.urlopen('http://twtraffic.tra.gov.tw/twrail/ScheduleDownload.htm').read())]])
複製代碼

在Ubuntu下xls轉html用到gnumeric套件中的ssconvert,如果尚未安裝gnumeric的話可以輸入
sudo apt-get install gnumeric
安裝gnumeric。
twrail.zip (154.38 KB, 下載次數: 329)


HTML檔轉PDF檔的工具就比較多了,Ubuntu下有wkhtmltopdf、calibre ebook-convert、htmldoc、Prince XML、……
twrail.pdf (4 MB, 下載次數: 240)

評分

參與人數 2金錢 +4 收起 理由
Sirius + 2 感謝分享
tinyding + 2 感謝分享

查看全部評分

發表於 19-2-2 14:34 | 顯示全部樓層
感謝樓主的分享!
您需要登錄後才可以回帖 登錄 | 註冊

本版積分規則

手機版|Archiver|站長信箱|廣告洽詢|COCO研究院

GMT+8, 24-12-23 13:58

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回復 返回頂部 返回列表
理財討論網站 |