📜  Python将 Html 转换为 PDF

📅  最后修改于: 2022-05-13 01:55:19.753000             🧑  作者: Mango

Python将 Html 转换为 PDF

将 HTML/网页转换为 PDF

有很多网站不允许下载 pdf 格式的内容,他们要么要求购买高级版,要么没有此类 pdf 格式的下载服务。

从网页/HTML 到 PDF 的 3 步转换

Step1:下载库pdfkit

$ pip install pdfkit

Step2:下载wkhtmltopdf
对于 Ubuntu/Debian:

sudo apt-get install wkhtmltopdf

对于 Windows:
(a)下载链接:WKHTMLTOPDF
(b)Set: PATH 变量设置环境变量中的二进制文件夹。

Step3: Python代码下载:
(i) 已保存的 HTML 页面

import pdfkit
pdfkit.from_file('test.html', 'out.pdf')

(ii) 通过网站 URL 转换

import pdfkit
pdfkit.from_url('https://www.google.co.in/','shaurya.pdf')

(iii) 以 PDF 格式存储文本

import pdfkit
pdfkit.from_string('Shaurya GFG','GfG.pdf')

恭喜:您的 pdf 文件将被创建并保存在Python文件所在的同一目录中。

杂项知识内容:
1.您可以传递一个包含多个 URL 或文件的列表:

pdfkit.from_url(['google.com', 'geeksforgeeks.org', 'facebook.com'], 'shaurya.pdf')
pdfkit.from_file(['file1.html', 'file2.html'], 'out.pdf')

2. 将内容保存在变量中

# Use False instead of output path to save pdf to a variable
pdf = pdfkit.from_url('http://google.com', False)