📜  pyspark 将浮点结果转换为整数替换 - Python (1)

📅  最后修改于: 2023-12-03 15:04:02.126000             🧑  作者: Mango

Pyspark将浮点结果转换为整数替换 - Python

在Pyspark中,经常遇到需要将浮点数结果转换为整数的情况。这可以通过Pyspark的内置函数来完成。本文将介绍如何使用Pyspark将浮点数结果转换为整数,并提供了一些代码示例来说明。

使用Pyspark将浮点数结果转换为整数

可以使用Pyspark的cast函数来将浮点数结果转换为整数。cast函数是Pyspark中的内置函数,可实现类型转换操作。以下是将浮点数结果转换为整数的Pyspark代码:

from pyspark.sql.functions import col

df = spark.createDataFrame([(1.5,), (2.8,), (4.0,), (6.2,)], ['values'])

df = df.withColumn('values', col('values').cast('integer'))

df.show()

在上面的代码中,我们首先导入了Pyspark的col函数。然后,我们创建了一个DataFrame,并将其命名为df。DataFrame只包含一个名为'values'的列,其中包含浮点数值。接下来,我们使用withColumn函数将数据类型从浮点数转换为整数。最后,我们展示了转换后的DataFrame。

示例

下面是一些使用Pyspark将浮点数结果转换为整数的示例代码:

from pyspark.sql.functions import col

# 示例1:创建DataFrame
df = spark.createDataFrame([(1.5,), (2.8,), (4.0,), (6.2,)], ['values'])
# 转换浮点数为整数
df = df.withColumn('values', col('values').cast('integer'))
# 展示转换后的DataFrame
df.show()

# 示例2:读取CSV文件
df = spark.read.csv('test.csv', header=True)
# 转换浮点数为整数
df = df.withColumn('values', col('values').cast('integer'))
# 展示转换后的DataFrame
df.show()

# 示例3:使用where和cast函数
df = spark.createDataFrame([(1.5,), (2.8,), (4.0,), (6.2,)], ['values'])
# 转换浮点数为整数
df = df.where(col('values') > 3).withColumn('values', col('values').cast('integer'))
# 展示转换后的DataFrame
df.show()

以上示例代码展示了如何在Pyspark中将浮点数结果转换为整数。第一个示例演示了如何创建DataFrame并将浮点数转换为整数。第二个示例演示了如何从CSV文件中读取数据并将浮点数转换为整数。第三个示例演示了如何使用where和cast函数将符合条件的浮点数转换为整数。

总结

本文介绍了如何在Pyspark中将浮点数结果转换为整数。我们使用Pyspark的cast函数实现了这一目标,并提供了示例代码来说明如何使用它。希望这篇文章能够帮助你更好地理解如何将浮点数结果转换为整数。