どうも、ちゃんかま(@chan_kama0244)でございます。
あなたはもしかして、スクレイピングに興味がある、Pythonの初心者さんではありませんか? それなら、「環境構築の方法を調べているけど、初心者の自分には無理そう・・・」と悩んでいませんか?
実は、Python初心者におすすめの、スクレイピングの環境構築の方法があります。それは、PythonとJupyterLabをインストールする方法です。なぜなら、この方法は環境構築の手順がシンプルで、初心者にも分かりやすいからです。
私は、独学でPythonのスクレイピングを学び、いくつかの環境構築の方法を試しました。 その結果、PythonとJupyterLabをインストールする方法が、一番簡単だと実感しました。
この記事では、PythonとJupyterLabによる、スクレイピングの環境構築の方法を教えます。この記事を読むと、初心者でも簡単にスクレイピングの環境構築ができます。
スクレイピングの環境構築とは?
スクレイピングとは、必要な情報を、Webサイトから自動で取得する技術のことです。例えば、飲食店の紹介サイトから店舗情報を取得したり、フリマサイトから商品情報を取得したりできます。取得した情報は一覧表にまとめて、ExcelやCSVファイルで出力します。
そして、スクレイピングを実行するためには、パソコンに環境を構築しなければなりません。プログラミング言語や、その言語のコードを書いて実行するエディターなどをインストールします。このような作業のことを、【スクレイピングの環境構築】と言います。
スクレイピングの環境構築の方法
ここでは、PythonとJupyterLabによるスクレイピングの環境構築の方法を解説します。面倒に感じるかもしれませんが、これから解説する手順どおりにやれば1時間もかかりません。初心者にも分かりやすいよう、画像つきで丁寧に解説します。
Pythonのインストール
まずは、パソコンにPythonをインストールします。以下のURLからPythonをインストールすることができます。Python公式のインストールサイトです。
https://www.python.org/downloads/
このURLをクリックすると、以下のようなページが表示されます。

Pythonのインストールに必要な、インストーラーをダウンロードするページになります。この中にある、【Download Python 3.11.2】のボタンをクリックします。クリックすることで、Pythonのインストーラーをダウンロードできます。
ちなみに、3.11.2の数値はPythonのバージョンです。Pythonのバージョンは随時更新されているので、現在の数値が画像と異なっていても大丈夫です。

ダウンロードボタンをクリックしたら、Windowsのエクスプローラーを確認します。エクスプローラーの【ダウンロード】フォルダの中身を見てみましょう。すると、Pythonのインストーラーがダウンロードできているかと思います。
では、ダウンロードできたPythonのインストーラーをダブルクリックで実行します。

インストーラーを実行すると、このような画面になります。

ここで、【Add python.exe to PATH】に✓をつけます。これに✓をつけると、Pythonの起動が非常に楽になります。そのため、忘れずに✓をつけましょう。

【Add python.exe to PATH】に✓をつけたら、【Install Now】をクリックします。ここをクリックすると、Pythonのインストールが始まります。

Pythonのインストール中は、このような画面が表示されます。緑のゲージが満タンになるまで待ちます。

Pythonのインストールが終わると、このような画面が表示されます。【Setup was successful】が表示されていれば、インストールは正常に完了しています。【Close】で画面を閉じます。

これでPythonのインストールは完了です。ここまでで、おそらく5分くらいで終わるかと思います。
JupyterLabのインストール
次は、JupyterLabをインストールします。JupyterLabは、Pythonをさらに便利に使える実行環境です。JupyterLabを使うと、以下のことがとても簡単にできます。
- スクレイピングのコードを書く。
- 書いたコードを実行する。
- 実行した結果を確認する。
JupyterLabは、Windows PowerShellを使ってインストールします。以下の方法で、Windows PowerShellを起動します。
まずは、Windowsボタン(Windowsのロゴマーク)をクリックします(画像①)。次に、検索窓に【powershell】と入力します(画像②)。ここで表示されるのが、【Windows PowerShell】です。開くをクリックして起動します(画像③)。

PowerShellが起動したら、以下のコマンドを入力し、エンターキーを押します。これで、JupyterLabのインストールが開始されます。
pip install jupyterlab

JupyterLabのインストールが終わると、このような画面になります。【Successfully installed】と【jupyterlab】が表示されていれば、インストールは正常に完了しています。
ちなみに、JupyterLabの他にも、何かたくさんのものがインストールされていますね。これは、JupyterLabに関連した、Pythonのライブラリになります。必要なものなので、このままにしておきます。

これで、PythonとJupyterLabのインストールが完了しました。つまり、Pythonスクレイピングの環境が構築できたことになります。
JupyterLabの使い方
Pythonスクレイピングのコードは、JupyterLabで書きます。ここでは、そのJupyterLabの使い方について解説します。
JupyterLabを起動する
JupyterLabを起動するためには、PowerShellで以下のコマンドを実行します。
jupyter lab

すると、Google Chromeで、JupyterLabが起動します。

ノートブックの新規作成
JupyterLabのファイルのことを、ノートブックと呼びます。拡張子は、【ipynb】になります。では、Pythonのコードを書くために、新規のノートブックを作成してみます。
ノートブックの新規作成の方法は以下のとおりです。
まずは、【+】ボタンをクリックします(画像①)。
すると、【Launcher】と呼ばれるものが起動します。
その中の、【Python3】ボタンをクリックします(画像②)。

すると、新規のノートブックが作成されます。

新規作成されたノートブックの名前は、【Untitled.ipynb】になります。このノートブックの名前を変更してみます。ノートブックを選択して右クリックをすると、メニューが表示されます。この右クリックメニューの中の、【Rename】でノートブックの名前を変更できます。

実際に、Untitled.ipynbから【python-scraping.ipynb】に変更してみます。

ノートブックの名前が、python-scraping.ipynbに変更できていることが分かります。
コードを書いて実行する
新規作成したノートブックにコードを書いて実行してみます。
JupyterLabでは、コードは【セル】と呼ばれる場所に書きます。実際に、セルに以下のコードを書いてみます。
print('Hello! Python-Scraping!')
書いたコードを実行するためには、再生ボタンをクリックします。

再生ボタンをクリックすると、書いたコードの下に実行結果が表示されます。ちなみに、再生ボタンをクリックする他に、ショートカットキーでもコードを実行できます。コードを実行するショートカットキーは、【shift+enter】です。
また、JupyterLabは、コードを実行したときにエラーを教えてくれます。例えば、セルに以下のコードを書いて実行してみます。
prin('Hello! Python-Scraping!')
こちらは、先程のコードのprintを【prin】に変更したものです。

実行すると、このように赤色で目立たせて、エラーを教えてくれます。「prinなんてコードは無いよ!」と、JupyterLabが教えてくれるのです。
セルの追加や削除
セルの追加や削除は、以下のボタンをクリックして行います。

ボタンをクリックする他に、ショートカットキーでもセルの追加や削除はできます。
操作 | ショートカットキー |
セルを上に追加 | (escで入力モードを解除してから)Aを押す |
セルを下に追加 | (escで入力モードを解除してから)Bを押す |
セルを削除 | (escで入力モードを解除してから)DDを押す |
ノートブックを保存する
ノートブックを保存するには、以下の画像のボタンをクリックします。

ボタンをクリックする他に、ショートカットキーでもノートブックの保存はできます。ノートブックを保存するショートカットキーは、【ctrl+S】です。
JupyterLabを終了する
JupyterLabは、以下の手順で終了させます。
まずは、【Kernel】タブをクリックします(画像①)。
その中の、【Shut Down All Kernels…】をクリックします(画像②)。

ここでは、【Shut Down All】をクリックします。

次に、【File】タブをクリックします(画像①)。
その中の、【Shut Down】をクリックします(画像②)。

さらに、もう一度【Shut Down】をクリックします。

この画面になったら、Google Chrome上のJupyterLabのタブを閉じます。これで、JupyterLabが終了します。

JupyterLabではいろいろな操作ができますが、その全てを覚える必要はありません。ここで解説した操作を覚えれば、初心者でもスクレイピングのコードを書くことはできます。
また、JupyterLabは、日本語化などの設定を変更することも可能です。JupyterLabの日本語化などの設定方法については、こちらの記事で詳しく解説しています。
Pythonスクレイピングの学習方法
ここでは、スクレイピングを学ぶことができる教材を紹介します。主な教材は、これらになります。
- YouTubeの無料動画
- スクレイピングの書籍
- Udemyの動画講座
YouTubeの無料動画
スクレイピングを無料で学習するなら、YouTubeの動画がおすすめです。YouTubeで【スクレイピング】をキーワードにして、検索してみてください。スクレイピングの学習動画が、たくさんあることが分かります。
私としては、以下の動画がおすすめだと思います。
スクレイピングの書籍
無料動画よりもさらに詳しく学びたいなら、スクレイピングの書籍が良いですね。
スクレイピングの書籍は、以下がおすすめです。Webサイト構造の知識や、デベロッパーツールの使い方などを、分かりやすく解説しています。
Udemyの動画講座
こちらのUdemyの動画講座もおすすめです。こちらの講座では、実際のスクレイピング案件を想定して、より実践的に学ぶことができます。また、分からないときは質問ができるので安心ですね。
【4つの実案件で学ぶ】Python Webスクレイピング完全パック
他の人のコードを見て学習
実は、他の人が書いたPythonのスクレイピングコードを見ると、とても勉強になります。ネット上に掲載されているコードもありますね。ただし、一部抜粋のコードが多かったり、解説が上級者向けだったりします。
そのため、もっと初心者向けに丁寧に解説されたコードを見てみたいですよね? それであれば、以下のリンクから私のココナラのサービスへご相談ください。

こちらのサービスでは、初心者向けに解説をつけた、Pythonのスクレイピングコードを提供します。さらに、スクレイピングに関する質問にもお答えします。相談は無料なので、興味がある場合は、遠慮なくココナラからメッセージを送ってください。
ココナラの会員登録がまだお済みでなければ、以下のリンクから無料で登録できます。
まとめ
PythonとJupyterLabの組み合わせであれば、簡単にスクレイピングの環境構築ができます。Python初心者にもおすすめの方法です。
補足として、Pythonスクレイピングの環境構築には、他にもいろいろな方法があります。ただし、私はこの記事で紹介した方法が、一番初心者向けだと思います。他の方法は、Pythonスクレイピングに慣れてきてから、試してみるのが良いかと思います。
また、Pythonスクレイピングができるようになると、副業で稼ぐことが可能になります。Pythonのスクレイピング副業に興味があるなら、こちらの記事も読んでみてください。
もしも、スクレイピングに関するエラーや疑問があれば、私のココナラのサービスをご利用ください。興味がある場合は、以下のリンクからどうぞ。
3日間の質問無制限|スクレイピングの疑問に答えます
こちらのサービスでは、Pythonの初心者向けに、スクレイピングに関する質問にお答えしています。スクレイピングのエラー解決や、コードの書き方などについても丁寧に解説します。相談は無料なので、スクレイピングに関する疑問があれば、遠慮なくメッセージを送ってください。
ココナラの会員登録がまだお済みでなければ、以下のリンクから無料で登録できます。
この記事があなたの参考になれば幸いです。
以上、ちゃんかま(@chan_kama0244)でした。
コメント