Google Sitesのバックアップメモ

Google Sitesについてはこちらで触れましたが、当社では社員間のコミュニケーションのツールのひとつとして活用しています。
そのサイトは社員のみが利用できる非公開のサイトとして運用しているのですが、今回はそのバックアップを取った際のメモです。

2009/09/28注記：Googleよりツールが公開されましたので、本記事に記載したノウハウはGoogle Sitesのバックアップには必要なくなりました。こちらの記事にまとめましたので、ご覧ください。

結論から言うと、（現時点の）GoogleSitesにはバックアップ＆リストアの機能がないので、wgetといったWebサイトのローカルコピーを作るソフトを使う必要があります。
リストアの手段はないのですが、Googleがファイルを全部失くしてしまったり、自分たちがコンテンツを全部消すようなオペレーションミスをすることはそんなにないと思うので、
いざというときは、ひとつひとつのコンテンツを再投稿すればよいかな、ということで。
で、今回のバックアップのキモは、いかにして、非公開の（ログインが必要な）サイトのコピーを取得するか、という点にあります。

ログインしたときの情報はブラウザにCookieという情報で保存される場合が多いので、ブラウザでログインした後にその情報を取得して、バックアップソフトにそれを適用することになります。
大雑把な手順を言うと、

FirefoxでGoogle Sitesにログイン＝＞Cookieファイルを取得＝＞Webサイトコピーソフトでバックアップ

という流れになります。
※InternetExplorer(IE)でもよい気がしますが、私の環境のIE7のCookieファイルエクスポート機能で出力したCookieファイルではうまくいかなかったので。
以下、手順の詳細を書きます。

事前準備

Firefox(Ver3.0.11 すでにPCにインストールされている前提です)にCookieファイル出力プラグインを入れる。

Export Cookiesをインストール。Firefoxで左記のリンク先のサイトを開き指示に従えばインストールできます。

ちなみに、古いバージョンのFirefoxではCookieがそのままテキストファイルで保存されていたようですが、現在ではsqliteのdbファイルになっているようですので、こういうテキスト化のpluginが必要です。

WebサイトのコピーソフトをPCにインストールする。

HTTrackをインストール。Cookieファイルが指定できるのでwgetでも大丈夫ですが、GUIでわかりやすいと思いますのでHTTrackで説明します。

手順

FirefoxでGoogle Sitesにログイン

説明の必要はないですね。普通にログインしてください。

Cookieファイルを取得

Firefoxの[ツール] – [Export Cookies…]を選んで、Cookieファイルを保存してください。

ちなみにブラウザはバックアップ終了までそのままいじらないでください。

Webサイトコピーソフトでバックアップ
1. HTTrackを起動し、新規プロジェクトを作成します。
2. それからこんな感じに、対象のGoogle SitesのURLを設定します。
3. オプション設定の画面の「スキャンルール」では取得対象のサイト・ファイルを指定します。
4. 次の画面で「設定のみで今はダウンロードを開始しない」を選んで、いったん完了させてください。
5. Cookieファイルをコピーします。
6. バックアップを開始する。

HTTrack使用上の注意

HTTrackの使い方の詳細についてはオフィシャルサイトとかを見てください。不用意に使用して、各地のWebサーバに余計な負荷をかけてしまうことのないようにご注意ください。
（私はこの記事を書くにあたって、かなりいろいろなところに負荷をかけてしまったと思います…）

ちなみに小規模なコンテンツなら、ブラウザのページ保存機能やWeBoXなどを使った方が手っ取り早いかもしれません。(本記事全否定ですね。。)

最後に

長々とお付き合いありがとうございました。
結構いろいろあって大変です。バージョンとか変わったらうまくいかないかもしれませんし、Google Sitesにバックアップ機能がつけばいらなくなるノウハウです。
まさにバッドノウハウってやつですね。

もっと簡単なやり方とかツールがあったら教えてください…

5 Comments

kyo 2009 年 6 月 29 日 at 11:26 AM

お久しぶりです～
wgetを使って、perlだけで同じようなことをしている人がいるようです。

http://blog.goo.ne.jp/ozoz-goo/e/df1a9584de24ffaf65e2c363c540652d

perlでできているから、シェルでもできそうな。
シェルだけで何でもやるのがすきなんです・・
oaka 2009 年 6 月 29 日 at 2:03 PM

コメントありがとうございます。
プログラムを書かずに簡単にできますよ～ってしたかったのですが、
結局プログラムを書いたほうが早いのでは？という内容になってしまいました。
次にバックアップを取る際には、いただいた情報を参考にさせていただきます！
＃googleさんはトリッキーなので、問題があったときに解析するのが大変そうです。。
kyo 2009 年 9 月 15 日 at 11:14 AM

こんにちは。
googleが、いろんなサービスのインポート/エキスポートに努力しているようです。

http://www.itmedia.co.jp/enterprise/articles/0909/15/news024.html

これみると、向こう数ヶ月のうちにSitesもインポート/エキスポートが出来るようになりそうですよ。
その機能を、バッチで使えれば良いんだけど・・
oaka 2009 年 9 月 15 日 at 12:39 PM

情報ありがとうございます！
たしかに
http://www.dataliberation.org/google/apps-for-business
をみると、”Coming this fall”ってありますね。
どんな風に使えるようになるのか興味深いですね。

ちなみに、こういう機能って我々（おそらく一般的な）システム開発者からすれば真っ先につくりそうな機能ですけど、それをせずにここまでやってきたGoogleさんの優先順位の付け方というかフットワークの軽さは、現状のサービスの広がりを見ると、見習うべきものがあるかもしれませんね。
（請負で開発する人とWebサービスを作る人の、顧客に対する考え方の違い、ともいえるかもしれませんが。）
oaka 2009 年 9 月 28 日 at 11:42 AM

本文にも注記を書きましたが、kyoさんに教えていただいたGoogleのインポート/エキスポートツールが公開されましたので、使ってみた感じを記事にまとめました。

http://blog.bitmeister.jp/?p=1256

kyoさんありがとうございます。

事前準備

手順

HTTrack使用上の注意

最後に

5 Comments

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル