十年網(wǎng)站開發(fā)經(jīng)驗(yàn) + 多家企業(yè)客戶 + 靠譜的建站團(tuán)隊(duì)
量身定制 + 運(yùn)營維護(hù)+專業(yè)推廣+無憂售后,網(wǎng)站問題一站解決
當(dāng)我們看到一篇好文章時(shí),難免會(huì)有想保存的想法,但是會(huì)存在作者刪除了文章或者鏈接丟失的情況。所以今天小編教大家如何在python中把html網(wǎng)頁轉(zhuǎn)換成PDF。

Python里面有個(gè)模塊是pdfkit,他可以幫咱們把一個(gè)html(也就是一個(gè)網(wǎng)頁)變成一個(gè)pdf文件。
pdfkit是Python對wkhtmltopdf這個(gè)把網(wǎng)頁轉(zhuǎn)成pdf工具的一個(gè)封裝,所以咱們必須得先安裝一個(gè)wkhtmltopdf,這個(gè)工具的下載網(wǎng)站是:https://wkhtmltopdf.org/downloads.html,根據(jù)自己的操作系統(tǒng)下載對應(yīng)的版本即可。
ps:這里要記住安裝目錄啊,下面要用到它,不要忘記它的安裝目錄~
上面說到了pdfkit這個(gè)模塊,這個(gè)是第三方模塊,需要安裝,使用pip安裝即可。
pip install pdfkit
pdfkit它給咱們提供了很多功能,可以給它一個(gè) url,他會(huì)自動(dòng)獲取 url 里面的內(nèi)容,幫你保存好,也可以給他一個(gè) html 文件,也可以保存,也可以給他一個(gè)字符串,也可以保存成 pdf。
下面是代碼:
import pdfkit url='https://www.cnblogs.com/sriba/p/8043294.html'#一篇博客的url confg = pdfkit.configuration(wkhtmltopdf='C:\Python35\wkhtmltopdf.exe') #這里指定一下wkhtmltopdf的路徑,這就是我為啥在前面讓記住這個(gè)路徑 pdfkit.from_url(url, 'jmeter_下載文件.pdf',configuration=confg) # from_url這個(gè)函數(shù)是從url里面獲取內(nèi)容 # 這有3個(gè)參數(shù),第一個(gè)是url,第二個(gè)是文件名,第三個(gè)就是khtmltopdf的路徑 #pdfkit.from_file('my.html', 'jmeter_下載文件2.pdf',configuration=confg) # from_file這個(gè)函數(shù)是從文件里面獲取內(nèi)容 # 這有3個(gè)參數(shù),第一個(gè)是一個(gè)html文件,第二個(gè)是文生成的pdf的名字,第三個(gè)就是khtmltopdf的路徑 html='''title
content
'''#這個(gè)html是我從一個(gè)頁面上拷下來的一段,也可以 #pdfkit.from_string(html, 'jmeter_下載文件3.pdf',configuration=confg) # from_file這個(gè)函數(shù)是從一個(gè)字符串里面獲取內(nèi)容 # 這有3個(gè)參數(shù),第一個(gè)是一個(gè)字符串,第二個(gè)是文生成的pdf的名字,第三個(gè)就是khtmltopdf的路徑
學(xué)會(huì)了的小伙伴以后再也不怕喜歡的文章被刪除或鏈接丟失啦。更多Python學(xué)習(xí)推薦:PyThon學(xué)習(xí)網(wǎng)教學(xué)中心。
(推薦操作系統(tǒng):windows7系統(tǒng)、Python 3.9.1,DELL G3電腦。)