【Python】webページのからテキストを抽出する

家計簿アプリの機能を自作プログラムで真似するためにはネットバンキングや証券口座に
ログインする必要があります。
ログインするためにはseleniumというライブラリを使用します。
なので事前にライブラリをインポートします。ログインしたページから情報を抽出するので
スクレイピング方式です。

ブラウザを立ち上げるためのwebdriverのダウンロードやネットバンキングへログイン
するためのプログラムはこちらの記事で触れています。

では、ログインした先のページからテキストを抽出していきます。

sample= driver.find_element(By.XPATH, ‘ここにXPATHを入力’)
sample.text

これで抽出できます。

資産データの抽出を想定しているので例えば20万円だった場合、「200,000」が抽出されて、
「,」があることでstr型になってしまいました。
この後のプログラム内で計算に使う場合は数値に変換する必要があります。
数値に変換は次のプログラムで実行します。

sample = sample.str.split(',').str[0:4].str.join(‘’)
sample = float(sample)

ここの型を変換するプログラムはまだまだ改善の余地はあると思います。
今の自分の精一杯です。

自分は資産の一部を米国の高配当個別株に投資しており、ドル資産もあるので抽出した日の為替レートから円換算するので数値の型に変換が必要でした。