台鐵時刻表(20140210起適用)(HTML版和PDF板)
高鐵有pdf格式的時刻表下載。台鐵只有xls格式的時刻表下載,而且還分散在25個xls檔案。於是用Python 2.7寫了一行程式將24個xls檔轉成1個html檔,以便無法上網時可以離線瀏覽。import re, subprocess, urllib; subprocess.call(['ssconvert', '--export-type=Gnumeric_html:html40frag', '-M', 'twrail.html'] + xls))"', urllib.urlopen('http://twtraffic.tra.gov.tw/twrail/ScheduleDownload.htm').read())]])
在Ubuntu下xls轉html用到gnumeric套件中的ssconvert,如果尚未安裝gnumeric的話可以輸入
sudo apt-get install gnumeric
安裝gnumeric。
HTML檔轉PDF檔的工具就比較多了,Ubuntu下有wkhtmltopdf、calibre ebook-convert、htmldoc、Prince XML、……
感謝樓主的分享!{:4_151:}
頁:
[1]