BeautifulSoup入門　スクレイピング実践編　HTML取得まで【python】

02 28, 2019

Home

Python

BeautifulSoup入門　スクレイピング実践編　HTML取得まで【python】

スクレイピングをしたい

Webサイトから情報をまとめてCSVでごにょごにょしたいなどにスクレイピングは便利です。
今回は、Pythonのスクレイピングによく使われるBeautifulSoupを使って勉強していきます。 BeautifulSoupには便利な機能がたくさんあります。今回はcrieitさんからデータを抜いていきます。（制作者のdalaさんには了解済み）

ライブラリの導入

BeautifulSoup単体ではURLをからデータを持ってこれません。 requestsを併用します。

from bs4 import BeautifulSoup
import requests

Requestsを使って、webからデータを取得

requestsを使用してデータを持ってきます。

url = "https://crieit.net/"
r = requests.get(url)

BeautifulSoupで要素を整形する

つぎにBeautifulSoupで要素を整形する

soup = BeautifulSoup(r.text)

出力してみる

出力してみましょう。今回は生のHTMLを吐き出します。

print(soup.prettify())

今回のコード

from bs4 import BeautifulSoup
import requests

url = "https://crieit.net/"
r = requests.get(url)
soup = BeautifulSoup(r.text)
print(soup.prettify())

今回のまとめ

とりあえず、HTMLとるとこまでいけました。次回は、タイトル全部抜いていきたいと思います。

動くサンプル

Python3

Corylog

GatsbyJS

Python

Books

BeautifulSoup入門　スクレイピング実践編　HTML取得まで【python】

スクレイピングをしたい

ライブラリの導入

Requestsを使って、webからデータを取得

BeautifulSoupで要素を整形する

出力してみる

今回のコード

今回のまとめ

動くサンプル

Corylog

GatsbyJS

Python

Books

BeautifulSoup入門 スクレイピング実践編 HTML取得まで【python】

スクレイピングをしたい

ライブラリの導入

Requestsを使って、webからデータを取得

BeautifulSoupで要素を整形する

出力してみる

今回のコード

今回のまとめ

動くサンプル

BeautifulSoup入門　スクレイピング実践編　HTML取得まで【python】