Python + Selenium で、簡単にブラウザの自動操作をする

mac 上の Python から、Selenium を使って簡単に Firefox を自動操作できます。 Firefox がインストールされている必要があります。Python は、2 でも 3 でも大丈夫です。 単純な Google 検索 コマンド1発で「Hello, world!」で google 検索をするところまでを書きます。 1. selenium をインストール $ sudo pip install selenium 2. pythonスクリプトを作成 hello_selenium.py

Python + Selenium で、簡単にブラウザの自動操作をする

EPUBファイルから画像を抽出する

電子書籍フォーマットとして広く使われている EPUB ファイルから、連番で画像を抽出する方法です。 ツール作りました! pip でインストールできます。https://github.com/ytyng/epub-extract-jpeg EPUB ファイルの概要 EPUB ファイルとは、平たく言えば ZIP圧縮された XHTML です。 コミックで一般的に使われる形式では、1ページが1つの XHTML ファイルになっており、その中に 1 つの img タグが あり、画像ファイルにリンクされています。 そのため、手順としては EPUB ファイルを解凍 構成情報の XML ファイルを解析し、ページ画像の URL (パス) を取得 ページ画像を連番で改名コピー(移動) となります。

EPUBファイルから画像を抽出する

TORICOの他のブログ投稿

最近の投稿

フィード

RSS / Atom