CSVからサイトマップの作成
2016年06月28日
サイトマップについて
サイトマップとは、サイトのウェブページのリストを指定して、Google や他の検索エンジンにサイトのコンテンツの構成を伝えるファイルです。Googlebot などの検索エンジンのウェブクローラは、このファイルを読み込んで、より高度なクロールを行います。
また、サイトマップでは、そこに指定するページに関する有益なメタデータを提供することができます。メタデータとは、ウェブページの最終更新日、更新頻度、サイト内の他の URL と比較した相対的な重要度などの関連情報です。
今回は、データベースにURLが格納されており、select文でcsvを出力して、そこからサイトマップを作りたいと思います。
下記のようなテーブルがあるします。
テーブル名: urlmaps カラム:id,url
下記のSQLを実行します。
下記のようなファイルが出力されます。
vim で「:%s/\n//g」で改行を全て削除します。

実行後の下記ファイルができます。最後のカンマします。

整形後のファイルは下記になります。
CSVファイル読み込んでサイトマップを作るプログラムを書きます。
ファイル名は「main.py 」とします。
urllib2を利用して、 HTTP ステータスコードを取得して、200ステータスを返すURLのみからサイトマップを作る方がいいと思いますが、今回は実装しておりません。
下記のようにファイルを設置します。

main.py を実行します。

実行するとsitemap.xmlができます。

sitemap.xml中身が下記のようになります。
次回は、「TensorFlowをインストールして、ネイル画像はどのように認識されるのか」をやりたい思います。
おまけで、「IBM bluemixではネイル画像はどのように認識されるか」もやりたいと思います。
サイトマップとは、サイトのウェブページのリストを指定して、Google や他の検索エンジンにサイトのコンテンツの構成を伝えるファイルです。Googlebot などの検索エンジンのウェブクローラは、このファイルを読み込んで、より高度なクロールを行います。
また、サイトマップでは、そこに指定するページに関する有益なメタデータを提供することができます。メタデータとは、ウェブページの最終更新日、更新頻度、サイト内の他の URL と比較した相対的な重要度などの関連情報です。
今回は、データベースにURLが格納されており、select文でcsvを出力して、そこからサイトマップを作りたいと思います。
下記のようなテーブルがあるします。
テーブル名: urlmaps カラム:id,url
ID | URL |
---|---|
1 | http://www.sumailab.net/index |
2 | http://www.sumailab.net/index/east.html |
3 | http://www.sumailab.net/index/mikawa.html |
4 | http://www.sumailab.net/index/west.html |
5 | http://www.sumailab.net/index/middle.html |
6 | http://www.sumailab.net/index/east.html |
下記のSQLを実行します。
下記のようなファイルが出力されます。
vim で「:%s/\n//g」で改行を全て削除します。

実行後の下記ファイルができます。最後のカンマします。

整形後のファイルは下記になります。
CSVファイル読み込んでサイトマップを作るプログラムを書きます。
ファイル名は「main.py 」とします。
urllib2を利用して、 HTTP ステータスコードを取得して、200ステータスを返すURLのみからサイトマップを作る方がいいと思いますが、今回は実装しておりません。
下記のようにファイルを設置します。

main.py を実行します。

実行するとsitemap.xmlができます。

sitemap.xml中身が下記のようになります。
次回は、「TensorFlowをインストールして、ネイル画像はどのように認識されるのか」をやりたい思います。
おまけで、「IBM bluemixではネイル画像はどのように認識されるか」もやりたいと思います。
Posted by iA SEチーム at 19:06│Comments(0)
│python