df.to_excel写入新数据不覆盖原有数据

默认情况下,如果使用 Pandas 的 to_excel() 方法将数据写入 Excel 文件时,会覆盖原有的数据。但是,你可以通过传递一些可选参数来更改此行为,具体如下:

  • startrowstartcol 参数:这两个参数可以控制将 DataFrame 数据写入 Excel 文件的起始行和列。通过设置它们的值,可以将数据写入现有表格中而不是覆盖原有数据。

  • mode 参数:该参数默认值为 'w',表示以写入模式打开文件,会覆盖原有的数据;如果将其设置为 'a',则会在现有数据的末尾添加新的数据。

例如,以下代码片段展示了如何将 DataFrame 数据写入 Excel 文件的第二行第一列,而不是覆盖原有数据:

import pandas as pd

# 读取现有数据
existing_data = pd.read_excel('existing_data.xlsx')

# 准备要写入的新数据
new_data = pd.DataFrame([['John', 32], ['Sara', 28]], columns=['Name', 'Age'])

# 将新数据添加到现有数据的末尾
combined_data = existing_data.append(new_data)

# 将数据写入 Excel 文件的第二行第一列
writer = pd.ExcelWriter('combined_data.xlsx')
combined_data.to_excel(writer, startrow=1, startcol=0)
writer.save()

在上面的代码中,首先从名为 existing_data.xlsx 的 Excel 文件中读取现有的数据。然后,准备要添加到现有数据的末尾的新数据,并将其添加到 existing_data DataFrame 中,得到 combined_data DataFrame 。最后,使用 to_excel() 方法将合并后的数据写入名为 combined_data.xlsx 的 Excel 文件的第二行第一列。使用 writer.save() 将更改保存到文件中。

如果将其设置为 'a',则会在现有数据的末尾添加新的数据

combined_data.to_excel('combined_data.xlsx', index=False, mode='a')

报错

FutureWarning: save is not part of the public API, usage can give unexpected results and will be removed in a future version writer.save()

这个警告信息是因为 writer.save() 不是 pandas 的公共 API 的一部分,而是其内部的处理逻辑。将来的版本中可能会删除此特性或更改其使用方法。

这意味着,虽然目前使用 writer.save() 可以成功将数据写入文件,但这种写法在未来的版本中可能会失效。建议使用更稳定、更可靠的方法来保存数据。

例如,可以使用 Python 的 with 语句和 Pandas 的 ExcelWriter 来打开和保存文件,这样就不需要显式调用 save() 方法了。以下是一个示例代码:

python
import pandas as pd

# 准备数据
data = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

# 创建 ExcelWriter 对象
with pd.ExcelWriter('example.xlsx') as writer:
    # 写入数据
    data.to_excel(writer, index=False, sheet_name='Sheet1')

 述代码中,首先准备了一个数据 DataFrame,然后使用 with 语句创建了一个 ExcelWriter 对象,to_excel() 方法将数据写入工作簿中。 index 参数设置为 False 表示不包含行索引。使用 with 语句,可以有效地管理文件句柄,并确保在退出代码块时安全地关闭文件。