如何在Python中使用fillna函数处理数据

507
2024/8/29 15:31:28
栏目: 编程语言
开发者测试专用服务器限时活动,0元免费领,库存有限,领完即止! 点击查看>>

fillna() 是 pandas 库中的一个函数,用于填充缺失值

  1. 首先,确保已经安装了 pandas 库。如果没有安装,可以使用以下命令进行安装:
pip install pandas
  1. 导入 pandas 库并创建一个包含缺失值(NaN)的 DataFrame:
import pandas as pd
import numpy as np

data = {'A': [1, 2, np.nan], 'B': [4, np.nan, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
print("原始 DataFrame:")
print(df)

这将输出以下内容:

原始 DataFrame:
     A    B  C
0  1.0  4.0  7
1  2.0  NaN  8
2  NaN  6.0  9
  1. 使用 fillna() 函数填充缺失值。有多种方法可以填充缺失值,例如使用常数、前一个值、后一个值等。以下是一些示例:
  • 使用常数填充缺失值(例如 0):
filled_df = df.fillna(0)
print("使用常数填充后的 DataFrame:")
print(filled_df)
  • 使用前一个值填充缺失值:
filled_df = df.fillna(method='ffill')
print("使用前一个值填充后的 DataFrame:")
print(filled_df)
  • 使用后一个值填充缺失值:
filled_df = df.fillna(method='bfill')
print("使用后一个值填充后的 DataFrame:")
print(filled_df)
  • 使用平均值填充缺失值:
filled_df = df.fillna(df.mean())
print("使用平均值填充后的 DataFrame:")
print(filled_df)

注意:在实际应用中,根据数据的特点和需求选择合适的填充方法。

辰迅云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>

推荐阅读: 怎么用python匹配数据