やろうと思って失敗したメモ (Distill代替)

FirefoxにDistillという拡張(アドオン)があります。
ファイルの更新状況を自力で(ローカルのPCのマシンパワーを使って)チェックする機能なのですが、登録サイト数が50件を超えるようになるとチェックに10分以上もかかってしまい、さらにCPUのリソースも食い潰すのでチェックしてる間はPCをまともに使えなくなるので困っています。
※内部的には1つ1つページにアクセスして、チェックする部分の差分を取得して前回チェック時から更新があればアラートを出すというかなり原始的な仕組みのようです。
その証拠にチェックが始まるとアクセス履歴がその(チェックした)ページでどんどん埋まっていきます。

そこでGoogle スプレッドシートのIMPORTXML関数を使って、ウェブページ上に記されている更新日時を引っ張って来て、前回のチェック日を格納しておくのが無理なので今日の日付との差分を算出して3日以内なら文字色を赤くするとか考えていたんだけど、Xpathを使ってうまく文字列を取得できなくて諦めた。

RSSなどにも対応していないので自力で取得するしかないんだけど。
WWWCは今や企業サイトでは主流となったhttpsなセキュアな通信に失敗してしまうので使えず。已む無くDistillを使い始めたんだけど、こんなにマシンパワーを食い潰すとは思わなんだ。

なんかいい方法ないかなぁ。

この投稿へのトラックバック

  1. […] 前回Distillの代替をGoogleスプレッドシートでやろうとして失敗して、なんかいい方法ないかなと探していたらTwitterから更新情報拾えばいいと思いつき、ではどうやって情報を拾うかと更 […]