pythonist 發表於 14-3-22 21:10

台鐵時刻表(20140210起適用)(HTML版和PDF板)

高鐵有pdf格式的時刻表下載。台鐵只有xls格式的時刻表下載,而且還分散在25個xls檔案。於是用Python 2.7寫了一行程式將24個xls檔轉成1個html檔,以便無法上網時可以離線瀏覽。
import re, subprocess, urllib; subprocess.call(['ssconvert', '--export-type=Gnumeric_html:html40frag', '-M', 'twrail.html'] + xls))"', urllib.urlopen('http://twtraffic.tra.gov.tw/twrail/ScheduleDownload.htm').read())]])

在Ubuntu下xls轉html用到gnumeric套件中的ssconvert,如果尚未安裝gnumeric的話可以輸入
sudo apt-get install gnumeric
安裝gnumeric。



HTML檔轉PDF檔的工具就比較多了,Ubuntu下有wkhtmltopdf、calibre ebook-convert、htmldoc、Prince XML、……


iwjmfupkwos 發表於 19-2-2 14:34

感謝樓主的分享!{:4_151:}
頁: [1]
查看完整版本: 台鐵時刻表(20140210起適用)(HTML版和PDF板)