【Python】スクレイピングでコメント行の次を取得したい

Pythonを使ってWEBスクレイピング(ウェブサイトから情報を抽出すること)をしてみた。

スクレイピング自体はとても簡単だ。

で、ページのソースが取得できる。(詳しく知りたい人は例のごとくググってくれ)

問題はここからだ。

取得した情報を解析して、必要な情報を抜き出すのに四苦八苦する。

そこで今回は、コメント行の次のPタグを抜き出す処理を実装してみたい。

どうだろうか。関数にしてみたので、自由に呼び出して使える。これからはデータを取得する手がかりにコメント行も使えるはずだ。

コメント

タイトルとURLをコピーしました