仕事であるアカウントのメールアドレスに大量のメールが届きます。
そのメールを分析しようと今はPythonでいろいろプログラムを
試しています。
PandasでDataFrameにメールの情報を読み出し、その時に返信や転送で
やり取りをするとRe:やFw:などの文字が並んで人が見れば同じ案件の
メールと判断できますが、Re:やFw:を消す前処理を実行しました。
まずは消したい単語をリスト化します。
# 件名につく不要語をreplace ignore_words_subject = ['Re: ', 'RE: ', 'Fw: ', 'FW: ', 'Fwd: ', 'FWD: ', 'Re:', 'RE:', 'Fw:', 'FW:', 'Fwd:', 'FWD:', ' ', ' ']
消す処理を実行します。
for i in range(0, len(df_mail_list)):# df_mail_listにOutlookから読み込んだメールの情報を格納 for word in ignore_words_subject: df_mail_list['subject'][i] = df_mail_list['subject'][i].replace(word, '')
この処理で返信などでやり取りをしてもRe:などを消して同じ件名のものが
複数並んでいる状態に処理します。
別途Pandasの機能を使って処理していきます。