【北行庵】  HOME旅行記一覧
検索エンジン対策
検索ロボット用サイトマップ

検索エンジンと検索サービスの相関表
TITLE と META 記述法
フレームページの検索ロボット対策
Amateur SEO
検索ロボット用サイトマップの設置
表示の乱れ? ブラウザ対策を
文字の大小ボタン、効果を拡大

◇◆◇

サイトマップには幾つかある。
誰でも知っているサイトマップはウェブサイトの公開ページ総リストです。通常はホームページのどこかにリンクがある。サイト訪問者が目的のページを探す手助けとなるものです。

ウェブサイトは検索エンジンのクローラー(検索ロボット)が時々潜り込み情報収集をしています。検索ロボットの機能上、他のサイトからリンクされていないページは検索エンジンに登録され難いとされる。そこで、サイト管理人は検索ロボットに情報収集して欲しいページを確実に伝える手段が必要になる。それが、ウェブサイト最上位ディレクトリに設置するサイトマップ( sitemap.txt / sitemap.xml )です。
このサイトマップは検索ロボット向けなので余計な説明やスペースは一切不要、サイト内で検索エンジンに登録したい全ページのURL( http:// から始まる絶対表記 )を1行1個だけ書き並べただけです。

以下、主サイトの全ページがグーグル検索から除外されて検索エンジン用サイトマップを設置する必要に迫られた経緯、そして2種の検索エンジン用サイトマップ( GOOGLE向け sitemap.txt / sitemap.xml )について簡単に説明してあります。

パニッシュの発生とその後の経過:
2007.11.30(?)
主要サーバー(Biglobe)に置いた全ページが Google の検索リストから完全に消滅した。
2007.12.02
旅行から帰宅しアクセス分析をみる。GOOGLE からのアクセスが全くない。調べると全ページがグーグルから除外されていた。ビックリでした。 ただし、使用4サーバーでは主サーパー Biglobe 以外のページは未だ Google で検索できる状態でした。
慌てて GOOGLE のサイトオーナー向けガイドラインを読む。「してはいけない」をやっていたのでグーグルからバニッシュされたことが判明した。
2007.12.04
Google Account (無料)に登録し、自サイトの状態が分かるようにする。
この時点の GOOGLE アカウントは「北行庵(Biglobe部分)」が未登録状態にあることを示していた。問題点、つまり「隠しリンク(サイト内ページ相互リンクのみ)」と「隠しキーワード(隠しリンクにキーワードを混入)」と「クローラー向け不正リンク集(主サイトに1ページ)」を大至急サイトから削除する必要があった。もちろん、その為に使用したスタイルシートも削除しなくてはならない。
ほぼ全部と云える程多くの旅行記ページと壁紙写真ページに検索ロボット向け不正隠し情報を設置していたので、削除と修正の作業にかなりの時間を要しました。
2007.12.25
パニッシュの原因とサイトの改善報告を記述し、GOOGLE アカウントから再審査リクエストを送信した。
2007.12.28
消滅していた主サイト「北行庵(Biglobe部分)」の大部分のページは Google の検索リストに復帰しました。
2007.12.28-29
Google アカウントを見ると、警告などの表示がある。再度、主サイトの全頁をチェック、見落したガイドライン違反を幾つも削除した。他にも、サブ・サイトの sitemap.txt に問題があり、訂正して UP した。


ホームページの管理者が検索エンジンからのアクセスを期待するなら、
GOOGLE ウェブマスター向けガイドライン
を熟読することがバニッシュ予防の最善策です。
GOOGLEではページランク向上にもつながるとしています。

検索エンジン向けサイトマップの設置:
当サイトのアクセスの多くはロボット型検索エンジンからです。GOOGLE の場合、2個以上のキーワードで検索すると上位20サイトにリストされるページも”それなりにかなり”ある状態でした。
例えそうとしても、「隠しリンク」の設置などガイドライン違反によるアクセスは砂上の楼閣に同じです。真っ当なページの多くは「 sitemap.txt /サイトマップ(UTF-8形式)」を各サイトのトップ・ディレクトリに設置だけで検索エンジンに登録される目的は達成できるのです。「 sitemap.txt (UTF-8形式)」の作り方は、1行1URLのサイトマップ・テキストを「名前を付けて保存(A)」する時に「文字コード(E)」で「UTF-8」を選んで保存するだけです。
当サイトも使用中の4サイト全てに同じ形式のサイトマップを設置した。無論、各サイトマップにリストするURLは該当サイトのもののみです。 しばらく後に、Googleアカウントからウェブマスターツールを開いた。登録した4サイトの全てが以下の写真のようにリストされていた。

GOOGLEアカウント

しかし、問題が発生した。
利用させて頂いている無料サイト AAA.LIVEDOOR.JP に設置した「 sitemap.txt /サイトマップ(UTF-8形式)」のみ、 GOOGLEアカウントのマイレポートで エラー ! と表示される。原因はサイトマップの形式が不適切なためと別ページにて説明があった。何らかの理由で AAA.LIVEDOOR.JP サーバーではサイトマップ(UTF-8形式)が適切に機能しない。
調べたところ、GOOGLE に XML形式のサイトマップを自動生成するページがある。

Google Sitemaps 用XML自動生成ツール
AAA.LIVEDOOR.JPに設置した「サイトマップ(UTF-8形式)」の全URLをクリップボードにコピーし、それを「XML自動生成ツール」の所定の場所にペーストする。すると、自動的に XML形式サイトマップが生成される。PCの適切なディレクトリにダウンロードするよう指定する。それから AAA.LIVEDOOR.JP の自サイトにアップロードした。今度は エラー ! が表示されず、機能する検索エンジン向けサイトマップとなった。


新ページの追加や古いページの削除などの更新があるなら、そのサイトの検索エンジン用サイトマップの更新も必要です。申請するとGOOGLEは数時間内にサイトマップの情報を収集してくれます。
◇◆◇
(2009.02.11 更新)(2008.01.05 UP)

< PREV.NEXT >