【第47回PYTHON講座】ファイルへのデータ追記方法

みなさん、こんにちは。
今回はファイルへのデータ追記方法を紹介しようと思います。

テキストファイルの追記方法
CSVファイルの追記方法
エクセルファイルに追記
LibreOffice ODSファイルに追記
まとめ

テキストファイルの追記方法

テキストファイル file02.txt のデータを、同じテキストファイル file01.txt に追記するコードです。

file_a = "C:/Labo/file01.txt"
file_b = "C:/Labo/file02.txt"

with open(file_b, "r", encoding='utf-8') as f:
    ls = f.readlines()

with open(file_a, "a", encoding='utf-8') as f:
    f.writelines("\n")
    f.writelines(ls)

４行目　追記するデータのファイルの読み込み

with open(file_b, "r", encoding='utf-8') as f:

with でファイルを開くと、閉じる処理の close は書く必要がありません。

encodingはテキストファイルのコーディングのタイプです。半角英数字のファイルの場合、encodingのオプションは不要ですが、日本語が含まれている場合は、指定する必要があります。utf-8 の他には、shift_jis、euc_jp、iso2022_jpなどがあります。テキストファイルがどのコーディングで書かれているかに合せて変更して下さい。解からない場合は、これらの４つのコーディングをそれぞれ記載して、試してみると簡単です。

７行目　追記先のファイルを開く

with open(file_a, "a", encoding='utf-8') as f:

”a” は append（追記）の略です。追記するので、追記モードでファイルを開きます。

８行目　改行を追記する

追記先のデータに改行がなければ、既存のデータの最終点から新たなデータが追記されます。改行が必要な場合は、下記を追記して下さい。

  f.writelines("\n")

CSVファイルの追記方法

CSVファイルはテキストファイルに数値をコンマ等で区切って入力したファイルのことを指し、基本的にはテキストファイルになります。その為、先述のテキストファイルの追記方法でも出来ますが、pandasを使うと簡単です。

CSVファイル file02.csv のデータを、同じくCSVファイル file01csvに追記するコードです。

import pandas as pd

file_a = "C:/Labo/file01.csv"
file_b = "C:/Labo/file02.csv"

df = pd.read_csv(file_b)
df.to_csv(file_a, mode='a', index=False)

５行目　追記するCSVファイルを読み込む

df = pd.read_csv(file_b)

追記するCSVデータを読み、データフレーム df に代入します。

６行目　追記されるCSVファイルに書き込む

df.to_csv(file_a, mode='a', index=False)

mode=’a’ とすることにより、追記する形式で書き込むます。

index=False としないと、１列目に自動で１から数字が代入されます。なので、そのまま追記したい場合は、index=Falseとして下さい。

エクセルファイルに追記

エクセルファイルに追記する場合、『openpyxl』というライブラリをインストールします。但し、コード上では定義する必要はありません。インストールする為に、下記のコマンドを実行して下さい。

pip install openpyxl

XLSMファイル file02.xlsm のデータを、同じくXLSMファイル file01.xlsmに追記するコードです。

エクセルファイルの場合、追記というのではなく、それぞれのデータを合体させて、ファイルに新たに書き込むという手段になります。

import pandas as pd

file_a = "C:/Labo/file01.xlsm"
file_b = "C:/Labo/file02.xlsm"

df = pd.read_excel(file_a, header=None)
df2 = pd.read_excel(file_b, header=None)
df3 = pd.concat([df, df2])

with pd.ExcelWriter(file_a) as writer:
    df3.to_excel(writer, sheet_name='Sheet1', index=False, header=None)

６～８行目　データの読み込みと結合

それぞれのファイルのデータをデータフレーム df、df2 に代入します。

header=None といのは、データにヘッダーが無い場合を指します。

pd.concatを使って、データフレーム df、df2を結合し、データフレーム df3とします。当然ながら、df2, dfと順番を変えると、データフレームの並びが異なってくるので、追記したいもの df2 は最後に指定してください。

１１，１２行目　データの書き込み

追記するのではなく、結合したデータフレーム df3 を上書きする形となります。

エクセルファイルになるので、どのシートに記載するかを sheet_name=’Sheet1′ で指定します。

index、headerが無い場合は、index = False、header = Noneとします。

LibreOffice ODSファイルに追記

LibreOffice ODFファイルに追記する場合、『odfpy』というライブラリをインストールします。但し、コード上では定義する必要はありません。インストールする為に、下記のコマンドを実行して下さい。

pip install odfpy

ODSファイル file02.ods のデータを、同じくODSファイル file01.odsに追記するコードです。

import pandas as pd

file_a = "C:/Labo/file01.ods"
file_b = "C:/Labo/file02.ods"

df = pd.read_excel(file_a, engine="odf", header=None)
df2 = pd.read_excel(file_b, engine="odf", header=None)
df3 = pd.concat([df, df2])

with pd.ExcelWriter(file_a, engine="odf") as writer:
    df3.to_excel(writer, sheet_name='Sheet1', index=False, header=None)

基本的は、先述のエクセルファイルと同じですが、engine=”odf” というオプションが付きます。