📜  Python | 使用Bokeh进行数据可视化

📅  最后修改于: 2020-04-16 14:58:35             🧑  作者: Mango

Bokeh是Python中的数据可视化库,可提供高性能的交互式图表和绘图。Bokeh输出可以通过笔记本,html和服务器等各种介质获得。可以将bokeh图嵌入Django和flask应用程序中。
Bokeh为用户提供了两个可视化界面:

bokeh.models:一种低级接口,为应用程序开发人员提供了高度的灵活性。
bokeh.plotting:用于创建可视化的高级界面。

要安装bokeh软件包,请在终端中运行以下命令:

pip install bokeh

用于生成散点图的数据集是从Kaggle收集的。
代码#1:散点标记
要创建散点圆形标记,请使用circle()方法。

# 导入模块
from bokeh.plotting import figure, output_notebook, show
# 输出到笔记本
output_notebook()
# 创建图
p = figure(plot_width = 400, plot_height = 400)
# 添加具有大小,颜色和Alpha的圆形渲染器
p.circle([1, 2, 3, 4, 5], [4, 7, 1, 6, 3],
         size = 10, color = "navy", alpha = 0.5)
# 显示结果
show(p)

输出:


代码2:单行
要创建单行,请使用line()方法。

# 导入模块
from bokeh.plotting import figure, output_notebook, show
# 输出到笔记本
output_notebook()
# 创建图
p = figure(plot_width = 400, plot_height = 400)
# 添加线条渲染器
p.line([1, 2, 3, 4, 5], [3, 1, 2, 6, 5],
        line_width = 2, color = "green")
# show the results
show(p)

输出:

代码3:条形图
条形图用矩形条显示分类数据。条的长度与所表示的值成比例。

# 导入必要的模块
import pandas as pd
from bokeh.charts import Bar, output_notebook, show
# 输出到笔记本
output_notebook()
# 读取数据帧中的数据
df = pd.read_csv(r"D:/kaggle/mcdonald/menu.csv")
# 创建栏
p = Bar(df, "Category", values = "Calories",
        title = "Total Calories by Category",
                        legend = "top_right")
# 显示结果
show(p)

输出:



代码4:箱形图
箱形图用于表示图中的统计数据。它有助于总结数据中存在的各种数据组的统计属性。

# 导入必要的模块
from bokeh.charts import BoxPlot, output_notebook, show
import pandas as pd
# 输出到笔记本
output_notebook()
# 读取数据帧中的数据
df = pd.read_csv(r"D:/kaggle / mcdonald / menu.csv")
# 创建栏
p = BoxPlot(df, values = "Protein", label = "Category",
            color = "yellow", title = "Protein Summary (grouped by category)",
             legend = "top_right")
# 显示结果
show(p)

输出:



代码5:直方图
直方图用于表示数值数据的分布。直方图中矩形的高度与分类间隔中值的频率成正比。

# 导入必要的模块
from bokeh.charts import Histogram, output_notebook, show
import pandas as pd
# 输出到笔记本
output_notebook()
# 读取数据帧中的数据
df = pd.read_csv(r"D:/kaggle / mcdonald / menu.csv")
# 创建直方图
p = Histogram(df, values = "Total Fat",
               title = "Total Fat Distribution",
               color = "navy")
# 显示结果
show(p)

输出:



代码6:散点图
散点图用于绘制数据集中两个变量的值。它有助于找到所选的两个变量之间的相关性。

# 导入必要的模块
from bokeh.charts import Scatter, output_notebook, show
import pandas as pd
# 输出到笔记本
output_notebook()
# 读取数据帧中的数据
df = pd.read_csv(r"D:/kaggle / mcdonald / menu.csv")
# 创建散点图
p = Scatter(df, x = "Carbohydrates", y = "Saturated Fat",
            title = "Saturated Fat vs Carbohydrates",
            xlabel = "Carbohydrates", ylabel = "Saturated Fat",
            color = "orange")
# show the results
show(p)

输出: