※ 当ブログではアフィリエイト広告を利用しています

【初心者でも簡単!】Pythonスクレイピングの環境構築方法

Pythonスクレイピングの環境構築方法Python

どうも、ちゃんかま(@chan_kama0244)でございます。

あなたはもしかして、スクレイピングに興味がある、Pythonの初心者さんではありませんか? それなら、「環境構築の方法を調べているけど、初心者の自分には無理そう・・・」と悩んでいませんか?

実は、Python初心者におすすめの、スクレイピングの環境構築の方法があります。それは、PythonとJupyterLabをインストールする方法です。なぜなら、この方法は環境構築の手順がシンプルで、初心者にも分かりやすいからです。

私は、独学でPythonのスクレイピングを学び、いくつかの環境構築の方法を試しました。 その結果、PythonとJupyterLabをインストールする方法が、一番簡単だと実感しました。

この記事では、PythonとJupyterLabによる、スクレイピングの環境構築の方法を教えます。この記事を読むと、初心者でも簡単にスクレイピングの環境構築ができます。

この記事で解説しているのは、Windowsでの環境構築の手順です。そのため、Macの場合は、一部参考にならない箇所があるかもしれません。

\スクレイピング副業やるならココナラ!/

スクレイピングの環境構築とは?

スクレイピングとは、必要な情報を、Webサイトから自動で取得する技術のことです。例えば、飲食店の紹介サイトから店舗情報を取得したり、フリマサイトから商品情報を取得したりできます。取得した情報は一覧表にまとめて、ExcelやCSVファイルで出力します。

そして、スクレイピングを実行するためには、パソコンに環境を構築しなければなりません。プログラミング言語や、その言語のコードを書いて実行するエディターなどをインストールします。このような作業のことを、【スクレイピングの環境構築】と言います。

環境構築とは、スクレイピングを実行するために必要なプログラミング言語やエディターなどをインストールする作業のこと。

スクレイピングの環境構築の方法

ここでは、PythonとJupyterLabによるスクレイピングの環境構築の方法を解説します。面倒に感じるかもしれませんが、これから解説する手順どおりにやれば1時間もかかりません。初心者にも分かりやすいよう、画像つきで丁寧に解説します。

Pythonのインストール

まずは、パソコンにPythonをインストールします。以下のURLからPythonをインストールすることができます。Python公式のインストールサイトです。
https://www.python.org/downloads/
このURLをクリックすると、以下のようなページが表示されます。

Python公式のインストールサイト
画像引用元:https://www.python.org/downloads/

Pythonのインストールに必要な、インストーラーをダウンロードするページになります。この中にある、【Download Python 3.11.2】のボタンをクリックします。クリックすることで、Pythonのインストーラーをダウンロードできます。

ちなみに、3.11.2の数値はPythonのバージョンです。Pythonのバージョンは随時更新されているので、現在の数値が画像と異なっていても大丈夫です。

Pythonのダウンロードボタンをクリック
画像引用元:https://www.python.org/downloads/

ダウンロードボタンをクリックしたら、Windowsのエクスプローラーを確認します。エクスプローラーの【ダウンロード】フォルダの中身を見てみましょう。すると、Pythonのインストーラーがダウンロードできているかと思います。

では、ダウンロードできたPythonのインストーラーをダブルクリックで実行します。

Pythonのインストーラー

インストーラーを実行すると、このような画面になります。

Pythonのインストーラーを起動

ここで、Add python.exe to PATH】に✓をつけます。これに✓をつけると、Pythonの起動が非常に楽になります。そのため、忘れずに✓をつけましょう。

チェックボックスにチェックをつける

【Add python.exe to PATH】に✓をつけたら、Install Now】をクリックします。ここをクリックすると、Pythonのインストールが始まります。

インストールボタンをクリック

Pythonのインストール中は、このような画面が表示されます。緑のゲージが満タンになるまで待ちます。

インストール時の画面

Pythonのインストールが終わると、このような画面が表示されます。【Setup was successful】が表示されていれば、インストールは正常に完了しています。【Close】で画面を閉じます。

インストール完了時の画面

これでPythonのインストールは完了です。ここまでで、おそらく5分くらいで終わるかと思います。

JupyterLabのインストール

次は、JupyterLabをインストールします。JupyterLabは、Pythonをさらに便利に使える実行環境です。JupyterLabを使うと、以下のことがとても簡単にできます。

JupyterLabでできること
  • スクレイピングのコードを書く。
  • 書いたコードを実行する。
  • 実行した結果を確認する。

JupyterLabは、Windows PowerShellを使ってインストールします。以下の方法で、Windows PowerShellを起動します。

まずは、Windowsボタン(Windowsのロゴマーク)をクリックします(画像①)。次に、検索窓に【powershell】と入力します(画像②)。ここで表示されるのが、【Windows PowerShell】です。開くをクリックして起動します(画像③)。

Windows PowerShellの起動方法

Windows PowerShellは、これからも頻繁に使用します。そのため、ショートカットにしておくことをおすすめします。

PowerShellが起動したら、以下のコマンドを入力し、エンターキーを押します。これで、JupyterLabのインストールが開始されます。

pip install jupyterlab
JupyterLabのインストールを実行

JupyterLabのインストールが終わると、このような画面になります。【Successfully installed】と【jupyterlab】が表示されていれば、インストールは正常に完了しています

ちなみに、JupyterLabの他にも、何かたくさんのものがインストールされていますね。これは、JupyterLabに関連した、Pythonのライブラリになります。必要なものなので、このままにしておきます。

JupyterLabのインストールが完了

これで、PythonとJupyterLabのインストールが完了しました。つまり、Pythonスクレイピングの環境が構築できたことになります。

PythonとJupyterLabをインストールすることで、スクレイピングの環境を構築できる。

JupyterLabの使い方

Pythonスクレイピングのコードは、JupyterLabで書きます。ここでは、そのJupyterLabの使い方について解説します。

JupyterLabを起動する

JupyterLabを起動するためには、PowerShellで以下のコマンドを実行します

jupyter lab
JupyterLabの起動方法

すると、Google Chromeで、JupyterLabが起動します。

JupyterLabが起動する

ノートブックの新規作成

JupyterLabのファイルのことを、ノートブックと呼びます。拡張子は、【ipynb】になります。では、Pythonのコードを書くために、新規のノートブックを作成してみます。

ノートブックの新規作成の方法は以下のとおりです。
まずは、【+】ボタンをクリックします(画像①)。
すると、【Launcher】と呼ばれるものが起動します。
その中の、【Python3】ボタンをクリックします(画像②)。

新規ノートブックの作成方法

すると、新規のノートブックが作成されます。

新規ノートブック

新規作成されたノートブックの名前は、【Untitled.ipynb】になります。このノートブックの名前を変更してみます。ノートブックを選択して右クリックをすると、メニューが表示されます。この右クリックメニューの中の、【Rename】でノートブックの名前を変更できます。

ノートブック名を変更する

実際に、Untitled.ipynbから【python-scraping.ipynb】に変更してみます。

ノートブック名が変更できている

ノートブックの名前が、python-scraping.ipynbに変更できていることが分かります。

コードを書いて実行する

新規作成したノートブックにコードを書いて実行してみます。

JupyterLabでは、コードは【セル】と呼ばれる場所に書きます。実際に、セルに以下のコードを書いてみます。

print('Hello! Python-Scraping!')

書いたコードを実行するためには、再生ボタンをクリックします。

コードを書き、実行する

再生ボタンをクリックすると、書いたコードの下に実行結果が表示されます。ちなみに、再生ボタンをクリックする他に、ショートカットキーでもコードを実行できます。コードを実行するショートカットキーは、【shift+enter】です。

また、JupyterLabは、コードを実行したときにエラーを教えてくれます。例えば、セルに以下のコードを書いて実行してみます。

prin('Hello! Python-Scraping!')

こちらは、先程のコードのprintを【prin】に変更したものです。

エラーを教えてくれる

実行すると、このように赤色で目立たせて、エラーを教えてくれます。「prinなんてコードは無いよ!」と、JupyterLabが教えてくれるのです。

セルの追加や削除

セルの追加や削除は、以下のボタンをクリックして行います。

セルの追加や削除

ボタンをクリックする他に、ショートカットキーでもセルの追加や削除はできます。

操作ショートカットキー
   セルを上に追加   (escで入力モードを解除してから)Aを押す
セルを下に追加(escで入力モードを解除してから)Bを押す
セルを削除(escで入力モードを解除してから)DDを押す

ノートブックを保存する

ノートブックを保存するには、以下の画像のボタンをクリックします。

ノートブックを保存する

ボタンをクリックする他に、ショートカットキーでもノートブックの保存はできます。ノートブックを保存するショートカットキーは、【ctrl+S】です。

JupyterLabを終了する

JupyterLabは、以下の手順で終了させます
まずは、【Kernel】タブをクリックします(画像①)。
その中の、【Shut Down All Kernels…】をクリックします(画像②)。

jupyterlabの終了方法(1)

ここでは、【Shut Down All】をクリックします。

jupyterlabの終了方法(2)

次に、【File】タブをクリックします(画像①)。
その中の、【Shut Down】をクリックします(画像②)。

jupyterlabの終了方法(3)

さらに、もう一度【Shut Down】をクリックします。

jupyterlabの終了方法(4)

この画面になったら、Google Chrome上のJupyterLabのタブを閉じます。これで、JupyterLabが終了します。

jupyterlabの終了方法(5)

JupyterLabではいろいろな操作ができますが、その全てを覚える必要はありません。ここで解説した操作を覚えれば、初心者でもスクレイピングのコードを書くことはできます。

また、JupyterLabは、日本語化などの設定を変更することも可能です。JupyterLabの日本語化などの設定方法については、こちらの記事で詳しく解説しています。

Pythonスクレイピングの学習方法

ここでは、スクレイピングを学ぶことができる教材を紹介します。主な教材は、これらになります。

スクレイピング学習の主な教材
  • YouTubeの無料動画
  • スクレイピングの書籍
  • Udemyの動画講座

YouTubeの無料動画

スクレイピングを無料で学習するなら、YouTubeの動画がおすすめです。YouTubeで【スクレイピング】をキーワードにして、検索してみてください。スクレイピングの学習動画が、たくさんあることが分かります。

私としては、以下の動画がおすすめだと思います。

スクレイピングの書籍

無料動画よりもさらに詳しく学びたいなら、スクレイピングの書籍が良いですね。

スクレイピングの書籍は、以下がおすすめです。Webサイト構造の知識や、デベロッパーツールの使い方などを、分かりやすく解説しています。

Udemyの動画講座

こちらのUdemyの動画講座もおすすめです。こちらの講座では、実際のスクレイピング案件を想定して、より実践的に学ぶことができます。また、分からないときは質問ができるので安心ですね。

【4つの実案件で学ぶ】Python Webスクレイピング完全パック

Just a moment...

他の人のコードを見て学習

実は、他の人が書いたPythonのスクレイピングコードを見ると、とても勉強になります。ネット上に掲載されているコードもありますね。ただし、一部抜粋のコードが多かったり、解説が上級者向けだったりします。

そのため、もっと初心者向けに丁寧に解説されたコードを見てみたいですよね? それであれば、以下のリンクから私のココナラのサービスへご相談ください。

サンプルコードあり|スクレイピングの疑問に答えます
/相談は無料!\

こちらのサービスでは、初心者向けに解説をつけた、Pythonのスクレイピングコードを提供します。さらに、スクレイピングに関する質問にもお答えします。相談は無料なので、興味がある場合は、遠慮なくココナラからメッセージを送ってください。

ココナラの会員登録がまだお済みでなければ、以下のリンクから無料で登録できます。

\スクレイピング副業やるならココナラ!/

まとめ

PythonとJupyterLabの組み合わせであれば、簡単にスクレイピングの環境構築ができます。Python初心者にもおすすめの方法です。

補足として、Pythonスクレイピングの環境構築には、他にもいろいろな方法があります。ただし、私はこの記事で紹介した方法が、一番初心者向けだと思います。他の方法は、Pythonスクレイピングに慣れてきてから、試してみるのが良いかと思います。

また、Pythonスクレイピングができるようになると、副業で稼ぐことが可能になります。Pythonのスクレイピング副業に興味があるなら、こちらの記事も読んでみてください。

もしも、スクレイピングに関するエラーや疑問があれば、私のココナラのサービスをご利用ください。興味がある場合は、以下のリンクからどうぞ。

3日間の質問無制限|スクレイピングの疑問に答えます
/相談は無料!\

こちらのサービスでは、Pythonの初心者向けに、スクレイピングに関する質問にお答えしています。スクレイピングのエラー解決や、コードの書き方などについても丁寧に解説します。相談は無料なので、スクレイピングに関する疑問があれば、遠慮なくメッセージを送ってください。

ココナラの会員登録がまだお済みでなければ、以下のリンクから無料で登録できます。

\スクレイピング副業やるならココナラ!/

この記事があなたの参考になれば幸いです。
以上、ちゃんかま(@chan_kama0244)でした。

コメント

タイトルとURLをコピーしました