Bloggerからの本文取得

Bloggerは勝手が他のものと違い本文が取得しづらかったので

 

本当は全ての記事テキストをスクレイピングしたい

 

 

今回はBloggerのURLをいじって出せるそれなりの記事を取得

使用するのはurllib.request それと BeaitudlSoup

 

 

Bloggerの場合はclass_='post-body entry-content'に本文のごちゃごちゃが入っている

 

ps = soup.find_all(class_='post-body entry-content')