|
高鐵有pdf格式的時刻表下載。台鐵只有xls格式的時刻表下載,而且還分散在25個xls檔案。於是用Python 2.7寫了一行程式將24個xls檔轉成1個html檔,以便無法上網時可以離線瀏覽。
- import re, subprocess, urllib; subprocess.call(['ssconvert', '--export-type=Gnumeric_html:html40frag', '-M', 'twrail.html'] + [filename for filename, _ in [urllib.urlretrieve(url, filename.decode('utf-8')) for url, filename in re.findall('"(http://.+20140210/(.+[.]xls))"', urllib.urlopen('http://twtraffic.tra.gov.tw/twrail/ScheduleDownload.htm').read())]])
複製代碼
在Ubuntu下xls轉html用到gnumeric套件中的ssconvert,如果尚未安裝gnumeric的話可以輸入
sudo apt-get install gnumeric
安裝gnumeric。
twrail.zip
(154.38 KB, 下載次數: 325)
HTML檔轉PDF檔的工具就比較多了,Ubuntu下有wkhtmltopdf、calibre ebook-convert、htmldoc、Prince XML、……
twrail.pdf
(4 MB, 下載次數: 236)
|
評分
-
查看全部評分
|