【PowerAutomate】Webページからデータを抽出する方法【スクレイピング】

この記事では、Power Automate for Desktopを使ってWebブラウザーからデータを取得する方法を、初心者でも簡単に理解できるように解説します。

特に、特定のWEBサイトを毎日チェックしているような繰り返しの作業を行っている方にとって、このツールは大変役立ちますので、ぜひお試しください。

基本の手順をマスターすれば、その応用範囲は広がります。データ収集の効率を上げ、作業の自動化に役立てることができます。

作成する前に

WebサイトによりRPAなどのロボットによるアクセスを禁止している場合もございますので、ご注意ください。

Webブラウザーの基本設定

Webブラウザーを使って作業を行う場合、各ブラウザ専用の拡張機能のインストールが必要になります。設定方法については、こちらの記事で詳しく説明していますので、ぜひご参照ください。

Webデータの取得方法

アクションをワークスペースに配置する

Webデータを取得するために使用するアクションは、
ブラウザー自動化 > Webデータ抽出 > Webページからデータを抽出するというアクションを使用します。

このアクションをワークスペース内に配置します。

アクション一覧

配置後表示される編集画面を開いたままデータを取得したい該当のWebページを開きます。

Webページからデータを抽出する
Webページを表示する

このウィンドウが表示されたらデータを取得するための設定を行っていきます。

もし表示されない場合は、Webページのどこかを左クリックしてください。

Webページを表示すると、左側に「抽出プレビュー」と書かれたウィンドウが表示されます。

法人番号公表サイト
データを取得する

マウスを動かすと赤枠が出現し、取得したいデータの上で赤枠が表示されたら、

①右クリック⇒②「要素の値を抽出」をクリック→③「テキスト」をクリックの順で選択します。

赤枠が表示されない場合は、「キャンセル」をクリックしてもう一度今までのフローを実行しなおしてみてください。

法人番号公表サイト
抽出プレビューを確認

抽出プレビューを確認し、データの取得が出来ているか確認します。

また複数データを取得する場合は、取得したいデータの上に赤枠が表示されたら、
①右クリック⇒②「要素の値を抽出」をクリック→③「テキスト」をクリックを繰り返します。

法人番号公表サイト
データ取得を終了する

抽出プレビューを確認し、全てのデータの取得が出来ているか確認します。

確認が取れ次第、「終了」をクリックします。

法人番号公表サイト
保存する

Power Automate for Desktopの画面になったら、「保存」をクリックします。

変数はデフォルトで「DataFromWebPage」となっています。

Webページからデータを抽出する
変数の中身を確認する

「Webページからデータを抽出する」アクションの設定が完了したので、一度フローを実行してみます。

実行が完了次第、「DataFromWebPage」の変数をダブルクリックして、データがうまく取得出来ているか確認します。

「DataFromWebPage」はDatatable型になるため、この後の処理で取得したデータを使用する場合は、「%DataFromWebPage[0][0]%」といった形で使用します。

変数

まとめ

今回はWebページからデータを抽出する方法をご紹介いたしました。
このやり方で様々なWebページからデータを取得することが出来ます。
また、応用することで、テーブル全体を抽出したりテキスト以外を取得したりすることも可能です。

お知らせ

みどりデジタルサポートでは、RPAで作成したフローの販売を行っております。

フローの購入はこちら⇒⇒https://mdsec.stores.jp/

作成したフローはこちら⇒⇒https://d-spport.jp/platform/rpaflow/


サービス

みどりデジタルサポートでは、PowerAutomateのフローの作成・相談・研修・サポートを行っています。

PowerAutomateの基礎研修からエラー発生時の即時サポートまで、RPAに関するあらゆるニーズにお応えします。
「○○の自動化が可能か?」や「○○の操作方法は?」などのご質問や要望があればお気軽にお問い合わせください。2営業日以内にご返信いたします。

RPAに関するお問い合わせはこちら

販売中のフロー

みどりデジタルサポートで作成したフローを下記よりご購入いただけます。フローの購入をご検討している方で何かご不明点等ございましたら、お気軽にお問い合わせください。