【Python】特定の単語を置き換える処理

プログラム

仕事であるアカウントのメールアドレスに大量のメールが届きます。
そのメールを分析しようと今はPythonでいろいろプログラムを
試しています。


PandasでDataFrameにメールの情報を読み出し、その時に返信や転送で
やり取りをするとRe:やFw:などの文字が並んで人が見れば同じ案件の
メールと判断できますが、Re:やFw:を消す前処理を実行しました。

まずは消したい単語をリスト化します。

# 件名につく不要語をreplace
ignore_words_subject = ['Re: ', 'RE: ', 'Fw: ', 'FW: ', 'Fwd: ', 'FWD: ', 'Re:', 'RE:', 'Fw:', 'FW:', 'Fwd:', 'FWD:', ' ', ' ']

消す処理を実行します。

for i in range(0, len(df_mail_list)):# df_mail_listにOutlookから読み込んだメールの情報を格納
    for word in ignore_words_subject:
        df_mail_list['subject'][i] = df_mail_list['subject'][i].replace(word, '')

この処理で返信などでやり取りをしてもRe:などを消して同じ件名のものが
複数並んでいる状態に処理します。

別途Pandasの機能を使って処理していきます。

タイトルとURLをコピーしました