Как сохранить новый лист в существующем файле excel, используя Pandas?

Я хочу использовать файлы excel для хранения данных, разработанных с помощью python. Моя проблема в том, что я не могу добавить листы в существующий файл excel. Здесь я предлагаю пример кода для работы, чтобы достичь этой проблемы

import pandas as pd
import numpy as np

path = r"C:UsersfedelDesktopexcelDataPhD_data.xlsx"

x1 = np.random.randn(100, 2)
df1 = pd.DataFrame(x1)

x2 = np.random.randn(100, 2)
df2 = pd.DataFrame(x2)

writer = pd.ExcelWriter(path, engine = 'xlsxwriter')
df1.to_excel(writer, sheet_name = 'x1')
df2.to_excel(writer, sheet_name = 'x2')
writer.save()
writer.close()

этот код сохраняет два фрейма данных на двух листах с именами "x1" и "x2" соответственно. Если я создам два новых фрейма данных и попытаюсь использовать один и тот же код для добавления двух новых листов, " x3 " и "x4", исходные данные будут потеряны.

import pandas as pd
import numpy as np

path = r"C:UsersfedelDesktopexcelDataPhD_data.xlsx"

x3 = np.random.randn(100, 2)
df3 = pd.DataFrame(x3)

x4 = np.random.randn(100, 2)
df4 = pd.DataFrame(x4)

writer = pd.ExcelWriter(path, engine = 'xlsxwriter')
df3.to_excel(writer, sheet_name = 'x3')
df4.to_excel(writer, sheet_name = 'x4')
writer.save()
writer.close()

Я хочу файл excel с четыре листа: "x1", "x2", "x3", "x4". Я знаю, что "xlsxwriter" - это не единственный "движок", есть "openpyxl". Я также видел, что уже есть другие люди, которые написали об этом вопросе, но я все еще не могу понять, как это сделать.

вот код, взятый из этого ссылке

import pandas
from openpyxl import load_workbook

book = load_workbook('Masterfile.xlsx')
writer = pandas.ExcelWriter('Masterfile.xlsx', engine='openpyxl') 
writer.book = book
writer.sheets = dict((ws.title, ws) for ws in book.worksheets)

data_filtered.to_excel(writer, "Main", cols=['Diff1', 'Diff2'])

writer.save()

Они говорят, что это работает, но трудно понять, как. Я не понимаю, что " ws.title", "ws" и "dict" находятся в этом контексте.

что является лучшим способом чтобы сохранить "x1" и "x2", закройте файл, откройте его снова и добавьте "x3"и " x4"?

4 ответов


спасибо. Я считаю, что полный пример может быть хорошим для кого-то еще есть некоторые проблемы:

import pandas as pd
import numpy as np

path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx"

x1 = np.random.randn(100, 2)
df1 = pd.DataFrame(x1)

x2 = np.random.randn(100, 2)
df2 = pd.DataFrame(x2)

writer = pd.ExcelWriter(path, engine = 'xlsxwriter')
df1.to_excel(writer, sheet_name = 'x1')
df2.to_excel(writer, sheet_name = 'x2')
writer.save()
writer.close()

здесь я генерирую файл excel, из моего понимания не имеет значения, генерируется ли он через "xslxwriter" или "openpyxl" engine.

когда я хочу писать без потери исходных данных, то

import pandas as pd
import numpy as np
from openpyxl import load_workbook

path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx"

book = load_workbook(path)
writer = pd.ExcelWriter(path, engine = 'openpyxl')
writer.book = book

x3 = np.random.randn(100, 2)
df3 = pd.DataFrame(x3)

x4 = np.random.randn(100, 2)
df4 = pd.DataFrame(x4)

df3.to_excel(writer, sheet_name = 'x3')
df4.to_excel(writer, sheet_name = 'x4')
writer.save()
writer.close()

этот код делает работу!


в примере вы разделили загрузке существующего файла в book и параметр writer.book значение book. В строю writer.sheets = dict((ws.title, ws) for ws in book.worksheets) вы получаете доступ к каждому листу в книге Как ws. Заголовок листа тогда ws таким образом, вы создаете словарь


Я настоятельно рекомендую вам работать непосредственно с openpyxl, так как теперь он поддерживает Pandas DataFrames.

Это позволяет сосредоточиться на соответствующем коде Excel и Pandas.


простой пример для записи нескольких данных в excel одновременно. А также, Когда вы хотите добавить данные на лист в написанный файл excel (закрытый файл excel).

когда вы впервые пишете в excel. (Запись " df1 "и" df2 "в" 1st_sheet "и" 2nd_sheet")

import pandas as pd 
from openpyxl import load_workbook

df1 = pd.DataFrame([[1],[1]], columns=['a'])
df2 = pd.DataFrame([[2],[2]], columns=['b'])
df3 = pd.DataFrame([[3],[3]], columns=['c'])

excel_dir = "my/excel/dir"

with pd.ExcelWriter(excel_dir, engine='xlsxwriter') as writer:    
    df1.to_excel(writer, '1st_sheet')   
    df2.to_excel(writer, '2nd_sheet')   
    writer.save()    

после закрытия excel, но вы хотите "добавить" данные в тот же файл excel, но другой лист, скажем, "df3" к имени листа "3rd_sheet".

book = load_workbook(excel_dir)
with pd.ExcelWriter(excel_dir, engine='openpyxl') as writer:
    writer.book = book
    writer.sheets = dict((ws.title, ws) for ws in book.worksheets)    

    ## Your dataframe to append. 
    df3.to_excel(writer, '3rd_sheet')  

    writer.save()     

будет обратите внимание, что формат excel не должен быть xls, вы можете использовать xlsx one.