【Python】pandasでcsvファイルを読み込む

プログラム

自分が書くプログラムでは結構な頻度でcsvファイルを読み込んだり書き込んだりします。
SBI証券の情報出力CSVの操作
この記事ではSBI証券からcsv出力した株情報を操作しています。

家計簿アプリを模倣して各ネットバンク、証券口座のデータを読み込んで
自分のExcel家計簿に入力すためにcsv出力しています。

SBI証券から出力したcsvファイルは文字コードがUTF-8のBOM付という
フォーマットでした。
SBI証券からPERの項目を出力し、「per.csv」というファイル名にしてます。

自分はVisual Code Studioをエディタに使用しています。
SBI証券から出力したファイルをこれで開くと右下で文字コードが確認できます。

UTF-8のBOM付のcsvは以下のコマンドで読み込みます。

per = pd.read_csv('per.csv', index_col=['コード'], encoding='utf-8-sig')

encodingをUTF-8でも読み込めるのですが、最初に不要なunicodeが表示されます。

index_colで一番左の列「コード」を行名として指定しています。

csvはwindowsでアイコンをダブルクリックして開こうとするとExcelで開く方が
ほとんどだと思いますが、文字コードがUTF-8のcsvファイルを開くと文字化けします。

今のところ、自分の経験上、utf-8,utf-8-sig,shift-jisのパターンで何とかなっています。

タイトルとURLをコピーしました