google ColaboratoryでCSVをダウンロードする

03 03, 2019

データをいろいろ扱いたい

google Colaboratoryは、環境構築不要で色々できるのが魅力です。 今回は前回格納したデータフレームをCSVにしてダウンロードしたいと思います。 google Colaboratoryのfilesを使えば簡単です。

元のコード

from bs4 import BeautifulSoup
import requests
import pandas as pd 

columns = ['title']
df = pd.DataFrame(columns=columns) 

base_url = "https://crieit.net/posts?page="

num = 1
while num <= 1:
 url=base_url+ str(num)
 r = requests.get(url)
 soup = BeautifulSoup(r.text)
 titles =soup.select("h5 a")
 if len(titles) == 0:
  print("これ以上記事はありません")  
  break
 num += 1
 for title in titles:
  se= pd.Series(title.text, columns)
  df = df.append(se, ignore_index=True)
df

追加するコード

from google.colab import files
filename =  "sample.csv"
df.to_csv(filename, encoding = 'utf-8-sig') 
files.download(filename)

from google.colab import files でファイルを扱えるようにします。 df.to_csv(filename, encoding = 'utf-8-sig') は、データフレームをUTF-8にエンコーディングします。 そしてダウンロードさせます。

動くサンプル

Python3


コリ

コリといいます。奈良県でサラリーマンをしています。GatsbyJSでサイトを作るのが趣味です。