Создание документа Python DataFrame для Word

Я работаю над созданием отчета, сгенерированного Python, который использует Pandas DataFrames. В настоящее время я использую метод DataFrame.to_string(). Однако это записывает файл в виде строки. Есть ли способ для достижения этого, сохраняя его как таблицу, чтобы я мог использовать формирование таблицы.

Код:

SEMorgkeys = client.domain_organic(url, database = "us", display_limit = 10, export_columns=["Ph,Pp,Pd,Nq,Cp,Ur,Tr"])
org_df = pd.DataFrame(SEMorgkeys)

f = open(name, 'w')
f.write("\nOrganic:\n")
f.write(org_df.to_string(index=False,justify="left"))
f.close()

Текущая распечатка (как строка):

CPC    Keyword                        Position Difference Previous Position Search Volume Traffic (%) Url                                               
75.92       small business factoring   0                   1                 210          11.69       https://www..com/small-business-f...
80.19              factoring company   0                   8                1600           5.72       https://www..com/factoring-vs-ban...

Ответы

Ответ 1

Вы можете написать таблицу прямо в файл .docx используя библиотеку python-docx.

Если вы используете Conda или установленный Python с помощью Anaconda, вы можете запустить команду из командной строки:

conda install python-docx --channel conda-forge

Или установить pip из командной строки:

pip install python-docx

После этого мы можем использовать его, чтобы открыть файл, добавить таблицу, а затем заполнить текст ячейки таблицы данными данных.

import docx
import pandas as pd

# i am not sure how you are getting your data, but you said it is a
# pandas data frame
df = pd.DataFrame(data)

# open an existing document
doc = docx.Document('./test.docx')

# add a table to the end and create a reference variable
# extra row is so we can add the header row
t = doc.add_table(df.shape[0]+1, df.shape[1])

# add the header rows.
for j in range(df.shape[-1]):
    t.cell(0,j).text = df.columns[j]

# add the rest of the data frame
for i in range(df.shape[0]):
    for j in range(df.shape[-1]):
        t.cell(i+1,j).text = str(df.values[i,j])

# save the doc
doc.save('./test.docx')

Ответ 2

def doctable(data, tabletitle, pathfile):
    from docx import Document
    import pandas as pd
    document = Document()
    data = pd.DataFrame(data)  # My input data is in the 2D list form
    document.add_heading(tabletitle)
    table = document.add_table(rows=(data.shape[0]), cols=data.shape[1])  # First row are table headers!
    for i, column in enumerate(data) :
        for row in range(data.shape[0]) :
            table.cell(row, i).text = str(data[column][row])
    document.save(pathfile)

Ответ 3

По какой-то причине первый столбец моего фрейма данных не отображается в слове при использовании этого кода - есть ли у кого-нибудь еще эта проблема? Первая строка содержит слова, а остальная часть фрейма данных состоит из цифр.

(Извините, я не могу комментировать сообщение, так как я новичок)

Спасибо