前回、Huginn を使用して Web サイトの RSS および WeChat パブリック アカウントの更新をキャプチャする方法について共有しましたが、多くの友人が、Huginn の設定が難しすぎる、多くのクローリング ルールが必要であるというメッセージを残しました。自分で調べてカスタマイズすることは比較的困難です。最も重要なことは、Huginn を構築するには自分でホスティング料金を支払う必要があるということです。
今日共有する Feed43 は、Huginn の RSS クローリングおよび購読機能に相当します。 Huginn には強力な機能があります。Huginn の RSS 購読だけを使用したい場合は、Web サイトから更新情報を購読できる無料のオンライン サービスである Feed43 に切り替えることをお勧めします。 Web サイトを使用しているかどうかに関係なく、ブラウザでアクセスできる Web ページのみが Feed43 に登録できます。
Feed43 には無料プランがあり、6 時間ごとにクロールされるため、頻繁に更新される Web サイトの購読には適していません。 Feed43 は、任意の Web サイトから RSS フィードを生成でき、このフィードを独自の RSS リーダーに挿入したり、iFTTT、fivefilters、freefullrss と連携して、RSS 全文の読み取り、電子メール通知、モバイル APP リマインダーを実現したりすることもできます。
より実用的なツールについては、以下もチェックしてください。
- 3 つのコマンド ツール Rsync、SCP、Tar-quick ソリューションによる VPS リモート Web サイトの再配置とデータ同期
- Huginn を使用して、あらゆる Web サイトから RSS および WeChat パブリック アカウントの更新を取得 - ワンストップの情報読み取りプラットフォームを作成
- VPS サーバーの信頼性の検出に役立つ 3 つの無料ツール - VPS ホストのパフォーマンスと速度のテスト方法
追記: 2018 年 1 月 31 日更新。独自のサーバーまたはホストを持っている友人は、サードパーティの RSS 購読サービスを使用するだけでなく、独自の RSS リーダーを構築することもできます。参考: 2 つの優れたオープンソース RSS リーダー。ツール: Miniflux および Tiny Tiny RSS 自作のオンライン RSS リーダー。
1. Feed43 を使用して、Web サイトの RSS を購読します。
公式ウェブサイト:
- HTTP://feed43.com/
Web サイトにアクセスするには、まずアカウントを登録します。Feed43 では、いつでも自分のフィードを管理および編集できます。
次に、購読したい Web サイトを追加できます。 文字化けがある場合は、エンコードをutf-8またはgbkに入力してください。
すると、Feed43 は Web ページの Html ソースコードを出力します。 [アイテム (反復可能) 検索パターン*:] にクロールするルールを入力します。 {%}
と {*}
の 2 つのパラメータがあります。 {%}
は変数を表し、{*}
は省略を表します。タイトルを取得したい場合は、タイトルの Html タグをコピーし、変数を置き換えて、不要な変数を省略してください。
以下に示すように、私が入手した wzfou.com のホームページの最新記事のルールを参照してください。
[抽出] をクリックした後にコンテンツがない場合は、最初に H タグのみを取得するなど、最も単純なタグから開始してから、他のコンテンツ タグを追加できます。確認したら、主にタイトル、コンテンツ、リンクなどの RSS テンプレートを決定します。上記で取得した {%}
に基づいて内容を入力します。
最後に、「プレビュー」をクリックすると、RSS フィードが正常に作成されたことがわかります。
この .xml アドレスをブラウザで開くと、RSS の更新内容が確認できます。 RSS リーダーを使用してこの RSS アドレスを購読できます。
もちろん、この RSS フィードはいつでも変更または削除することもできます。
2. 無料で自作の RSS フィード全文を読むことができます
2.1 RSS 全文購読オンライン Web サイト
RSS 購読アドレスを入力していれば、次の Web サイトを使用して RSS 全文を購読できます。
- http://fetch RSS.com
- http://five filters.org
- HTTP://フルコンテンツ RSS.com/
- HTTPS://wuwuwu.無料全RSS.com/
その中で、freefullrss は完全に無料です。RSS 購読アドレスを入力してください。
すると、freefullrss が RSS 全文を生成します。
このアドレスを使用して RSS リーダーを購読できます。RSS リーダーに表示される内容は、購読の全文です。 (拡大するにはクリックしてください)
2.2×2 自作RSS全文購読サービス
プロジェクトアドレス:
- ビットバケット: https://bitbucket.org/fivefilters/full-text-rss
- Github: https://github.com/Dither/full-text-rss
フルテキスト RSS の bitbucket プロジェクトが更新されたようです。git clone https://bitbucket.org/fivefilters/full-text-rss.git を使用して最新のものをダウンロードできます。全文 RSS は単なる PHP プログラムであり、データベースは必要ありません。したがって、全文 RSS をダウンロードした後、それを解凍し、送信するためにサーバーに直接アップロードします。
次に、URL を開くと、全文 RSS インターフェイスに入り、全文を取得する RSS アドレスを入力できます。
解析後、RSS の全文がブラウザに表示されます。
全文RSSは、任意のWebサイトのRSSをクローリングする機能も提供します。ただし、最初にクロール ルールを策定する必要があります。全文 RSS 公式 Web サイトには、ネチズン自身が作成した何千もの Web サイト ルールも提供されており、それらを直接使用できます。方法は次のとおりです。
- ディレクトリを入力します: site_config/standard/
- ディレクトリ内のすべてのコンテンツを削除します
- コマンドを実行します:
git clone https://github.com/fivefilters/ftr-site-config.git .
- Git は最新のサイト構成ファイルのダウンロードを開始します
- 更新する場合は、上記の操作を繰り返すか、
git pull
を使用できます。
もちろん、フルテキスト RSS によって提供されるオンラインで生成された RSS フィード (http://createfeed.fivefilters.org/) を使用することもできます。購読したい Web サイトのアドレスを入力してください。
次に、コンテンツを更新する Web ページを選択します。この時点で、fivefilters によって Web サイトのクロール ルールが生成されます。クリックするだけでダウンロードできます。
ダウンロードした設定ファイルを site_config/standard/ にアップロードします。
3. IFTTT: RSS メール通知と APP リマインダーを実装する
RSS サブスクリプションと IFTTT を組み合わせると、IFTTT は RSS サブスクリプションのコンテンツを電子メール、携帯電話、コンピューター、その他の端末デバイスにプッシュできます。
IFTTT で RSS 購読アドレスを追加すると、モバイル APP でリマインダーを受信できるようになります。
さらに、Blogtrottr はキーワード フィルタリングと RSS のプッシュをサポートしているため、興味のある RSS 購読コンテンツ (https://blogtrottr.com/) のみを受け取ることができます。
4. まとめ
Feed43 は、あらゆる Web サイトを購読して RSS アドレスに変換できる非常に強力なクロール ツールです。残念ながら、無料ユーザーは 6 時間ごとにのみ更新できます。無料の RSS フィード全文閲覧サービスには多くの制限があり、一部のサービスはまだあまり安定していないため、自分で構築することをお勧めします。
今のところ唯一の問題は、Feed43 が閉鎖しないことを願うことです。結局のところ、これは無料のサードパーティ サービスであり、RSS は現在不景気ではありません。 Web サイトを掘り出す唯一の方法は、Huginn を使用して、あらゆる Web サイトから RSS および WeChat パブリック アカウントの更新情報を取得し、ワンストップの情報読み取りプラットフォームを作成することです。