SOLG System Blog

CSVからサイトマップの作成

2016年06月28日

サイトマップについて
サイトマップとは、サイトのウェブページのリストを指定して、Google や他の検索エンジンにサイトのコンテンツの構成を伝えるファイルです。Googlebot などの検索エンジンのウェブクローラは、このファイルを読み込んで、より高度なクロールを行います。
また、サイトマップでは、そこに指定するページに関する有益なメタデータを提供することができます。メタデータとは、ウェブページの最終更新日、更新頻度、サイト内の他の URL と比較した相対的な重要度などの関連情報です。

今回は、データベースにURLが格納されており、select文でcsvを出力して、そこからサイトマップを作りたいと思います。

下記のようなテーブルがあるします。
テーブル名: urlmaps カラム:id,url
IDURL
1 http://www.sumailab.net/index
2 http://www.sumailab.net/index/east.html
3 http://www.sumailab.net/index/mikawa.html
4 http://www.sumailab.net/index/west.html
5 http://www.sumailab.net/index/middle.html
6 http://www.sumailab.net/index/east.html


下記のSQLを実行します。


下記のようなファイルが出力されます。


vim で「:%s/\n//g」で改行を全て削除します。
CSVからサイトマップの作成

実行後の下記ファイルができます。最後のカンマします。
CSVからサイトマップの作成

整形後のファイルは下記になります。


CSVファイル読み込んでサイトマップを作るプログラムを書きます。
ファイル名は「main.py 」とします。

urllib2を利用して、 HTTP ステータスコードを取得して、200ステータスを返すURLのみからサイトマップを作る方がいいと思いますが、今回は実装しておりません。

下記のようにファイルを設置します。
CSVからサイトマップの作成

main.py を実行します。
CSVからサイトマップの作成

実行するとsitemap.xmlができます。
CSVからサイトマップの作成

sitemap.xml中身が下記のようになります。



次回は、「TensorFlowをインストールして、ネイル画像はどのように認識されるのか」をやりたい思います。
おまけで、「IBM bluemixではネイル画像はどのように認識されるか」もやりたいと思います。




Posted by iA SEチーム at 19:06│Comments(0)python
上の画像に書かれている文字を入力して下さい
<ご注意>
書き込まれた内容は公開され、ブログの持ち主だけが削除できます。

PageTop

削除
CSVからサイトマップの作成
    コメント(0)