Python + Selenium で、簡単にブラウザの自動操作をする

(コメント)

mac 上の Python から、Selenium を使って簡単に Firefox を自動操作できます。

Firefox がインストールされている必要があります。Python は、2 でも 3 でも大丈夫です。

単純な Google 検索

コマンド1発で「Hello, world!」で google 検索をするところまでを書きます。

1. selenium をインストール

$ sudo pip install selenium

2. pythonスクリプトを作成

hello_selenium.py

#!/usr/bin/env python

from selenium import webdriver

if __name__ == '__main__':
    driver = webdriver.Firefox()
    driver.get('http://google.com')
    driver.find_element_by_css_selector(
        'input[name="q"]').send_keys("Hello, world!")
    driver.find_element_by_css_selector('input[type="submit"]').click()

3. 実行

$ chmod +x hello_selenium.py
$ ./hello_selenium.py

Firefoxが起動し、Hello, world! で Google 検索されたと思います。簡単ですね。

このパターンは、フォームに入力し submit するだけですが、応用すると認証ページに自動ログインしたりなどはすぐに書けると思います。

いつも使っている Firefox ではなく、クッキーや履歴などがまっさらな状態の Firefox を簡単につくれるので、テストには重宝します。

何度も実行すると、Dock が Firefox だらけになります。以下のコマンドで一気に kill できます。

$ killall firefox-bin

スマートフォンの User-Agent でアクセスする

#!/usr/bin/env python

from selenium import webdriver

if __name__ == '__main__':
    user_agent = "Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D) " \
                 "AppleWebKit/535.19 (KHTML, like Gecko) " \
                 "Chrome/18.0.1025.166 Safari/535.19"

    profile = webdriver.FirefoxProfile()
    profile.set_preference("general.useragent.override", user_agent)
    driver = webdriver.Firefox(firefox_profile=profile)
    driver.get('http://www.mangazenkan.com')

webdriver.Firefox の引数に、FirefoxProfile を与えると設定を変更できます。 これは、Android のUA を設定しているので、UA で表示を分けているタイプのサイトでは、SP 表示のテストができます。

レスポンシブデザインが主流だと思うので、あまり UA で分岐するようなサイトは最近見ませんけどね。

プロキシ設定をする (socks)

#!/usr/bin/env python

from selenium import webdriver

if __name__ == '__main__':
    profile = webdriver.FirefoxProfile()
    profile.set_preference('network.proxy.type', 1)
    profile.set_preference('network.proxy.socks', '127.0.0.1')
    profile.set_preference('network.proxy.socks_port', 10080)
    driver = webdriver.Firefox(firefox_profile=profile)
    driver.get('http://example.com')

これで、プロキシの socks 設定を上書きできますので、

$ ssh -N -D 10080 ubuntu@example.com

予め、このようなコマンドで socks トンネルを作っておき、( デーモンモードで起動するには -f を付与します。& してもいいかも)

このコマンドを実行すれば、socks 先の踏み台サーバを経由して Firefox を使えるため、アクセス元を考慮した確認に大変便利です。例えば、外国からのアクセスを試してみたい場合など。

現在の評価: 5

コメント

検索

最近のツイート

  • ytyng

    ytyng @ytyng

    難病に対する基金が設立されました。 #せりか基金 -宇宙兄弟ALSプロジェクト- https://t.co/zmh8TG1mRq
    1 週間 前

  • 大塚びる@ミス漫画全巻準グランプリ

    大塚びる@ミス漫画全巻準グランプリ @biru_otsuka

    ytyng

    やっと、、やっと、、、注文の仕方を失敗して遅くなったけど漫画全巻ドットコムさん宅からエンジェルハート全巻届きましたー♥️書き下ろしの収納ボックス付♥️マジで幸せ…ありがとう北条司先生…ポイントで買う際は私みたいにならないようにne… https://t.co/u7i7t9C5Gs
    4 週間, 1 日 前

  • ytyng

    ytyng @ytyng

    やっぱり Chrome58から、SSL証明書の CN= 見なくなったんだよね。自分の中で「そんなはずあるのか」と思いながら検証したけどやっぱ見てなくて、SANにドメイン書かないといけないみたい。
    1 ヶ月 前

  • ytyng

    ytyng @ytyng

    Chrome58 自己証明書でエラーが出る話、SHA1の対応廃止とCN=の扱い変わった問題で混乱している。SHA256にして、CN を X509v3 Subject Alternative Name (SAN) に書けば大丈夫なのはわかった。
    1 ヶ月 前

  • ytyng

    ytyng @ytyng

    替わりに、と書いたけど前からか。CN= を見なくなった変更ですね。
    1 ヶ月 前