Python将 Html 转换为 PDF
将 HTML/网页转换为 PDF
有很多网站不允许下载 pdf 格式的内容,他们要么要求购买高级版,要么没有此类 pdf 格式的下载服务。
从网页/HTML 到 PDF 的 3 步转换
Step1:下载库pdfkit
$ pip install pdfkit
Step2:下载wkhtmltopdf
对于 Ubuntu/Debian:
sudo apt-get install wkhtmltopdf
对于 Windows:
(a)下载链接:WKHTMLTOPDF
(b)Set: PATH 变量设置环境变量中的二进制文件夹。
Step3: Python代码下载:
(i) 已保存的 HTML 页面
import pdfkit
pdfkit.from_file('test.html', 'out.pdf')
(ii) 通过网站 URL 转换
import pdfkit
pdfkit.from_url('https://www.google.co.in/','shaurya.pdf')
(iii) 以 PDF 格式存储文本
import pdfkit
pdfkit.from_string('Shaurya GFG','GfG.pdf')
恭喜:您的 pdf 文件将被创建并保存在Python文件所在的同一目录中。
杂项知识内容:
1.您可以传递一个包含多个 URL 或文件的列表:
pdfkit.from_url(['google.com', 'geeksforgeeks.org', 'facebook.com'], 'shaurya.pdf')
pdfkit.from_file(['file1.html', 'file2.html'], 'out.pdf')
2. 将内容保存在变量中
# Use False instead of output path to save pdf to a variable
pdf = pdfkit.from_url('http://google.com', False)