みなさん、こんにちは。
今回はサイト上のファイルをダウンロードする方法を紹介しようと思います。
『wget』でダウンロード
ダウンロードするには、wgetというプログラムを使用します。
これはPYTHONのライブラリではなく、コマンドプロンプトで動作するプログラムです。
コマンドプロンプトで wget と入力して、パソコン内にwgetがインストールされているかを確認してください。インストールされていなければ、下記の記事を参照してください。
このwgetとPYTHONを使用してウェブ上のファイルをダウンロードするプログラムを作成します。
使用するライブラリ subprocess
今回は、subprocess というライブラリを使用します。
subprocessは標準でインストールされているライブラリなので、新たにインストールする必要はありません。
コマンドプロンプトで動かすプログラムを、PYTHONで動作させる時に使用します。
プログラムコードの説明
import subprocess
cmd = "wget https://test.com/test.pdf"
subprocess.call(cmd, shell=True)
1行目 ライブラリのインポート
subprocessをインポートします。
3行目 コマンドの文字列
wgetでファイルをダウンロードする場合、コマンドプロンプトで下記のように記入します(プログラム上で示したURLは実在しません)。
wget ファイルのURL
上記のコマンドをPYTHONで実行させるために、文字列cmdに保管します。
5行目 ダウンロードの実行
PYTHONで外部プロセスとなるcmdを、subprocessで実行します。これで終わりです。
応用例
前回、ウェブ上のPDFのリスト化するプログラムを紹介しました。
例えば、ウェブ上のPDFのリスト化したものを、下記のように取り出して、ループ化すれば、ウェブ上のファイルをすべて取得することが出来ます。大量にファイルをダウンロードしたい場合だと便利ですよね。
cmd = "wget ファイルのリスト[i]"
まとめ
いかがだったでしょうか。
学業や研究では沢山の参考資料をダウンロードする機会があると思います。zipでまとめてくれていればいいですが、ウェブ上にここにアップロードされている場合は、上記のようにPYTHONでダウンロードするプログラムを作ると便利だと思います。
前回の講座と今回の講座をうまく組み合わせてプログラム作成してみてはいかがでしょうか。
「役に立った!」と思れましたら、下のSNSボタンで記事のシェアをしていただけると嬉しいです!
コメント