Letztes Mal habe ich die Verwendung von Huginn zum Erfassen der öffentlichen RSS- und WeChat-Kontoaktualisierungen einer Website geteilt. Viele Freunde haben Nachrichten hinterlassen, in denen sie sagten, dass Huginn zu schwierig zu konfigurieren sei und es keine vorgefertigten Szenariobibliotheken gebe Die Definition ist relativ schwierig. Das Wichtigste ist, dass Sie für den Aufbau von Huginn selbst eine Hosting-Gebühr zahlen müssen.
Der Feed43, den ich heute teile, entspricht der RSS-Crawling- und Abonnementfunktion von Huginn. Huginn verfügt über leistungsstarke Funktionen. Wenn Sie nur das RSS-Abonnement von Huginn nutzen möchten, können Sie auch zu Feed43 wechseln, einem kostenlosen Onlinedienst zum Abonnieren von Updates von jeder Website. Unabhängig davon, ob Sie eine Website nutzen, können bei Feed43 nur Webseiten abonniert werden, die mit einem Browser aufgerufen werden können.
Feed43 verfügt über einen kostenlosen Plan und wird alle 6 Stunden gecrawlt. Daher eignet sich Feed43 nicht zum Abonnieren von Websites, die häufig aktualisiert werden. Feed43 kann RSS-Feeds von jeder Website generieren, und Sie können diesen Feed dann in Ihren eigenen RSS-Reader einfügen oder auch mit iFTTT, fivefilters und freefullrss zusammenarbeiten, um RSS-Volltextlesung, E-Mail-Benachrichtigungen und mobile APP-Erinnerungen zu erreichen.
Weitere praktische Tools finden Sie auch unter:
- Drei Befehlstools: Rsync, SCP und Tar – schnelle Lösung für die VPS-Remote-Website-Verlagerung und Datensynchronisierung
- Verwenden Sie Huginn, um Aktualisierungen öffentlicher RSS- und WeChat-Konten von jeder Website zu erfassen – schaffen Sie eine zentrale Plattform zum Lesen von Informationen
- Drei kostenlose Tools, die Ihnen helfen, die Authentizität von VPS-Servern zu erkennen – VPS-Hostleistungs- und Geschwindigkeitstestmethoden
PS: Aktualisiert am 31. Januar 2018 Zusätzlich zur Nutzung von RSS-Abonnementdiensten von Drittanbietern können Freunde, die über eigene Server oder Hosts verfügen, auch ihre eigenen RSS-Reader erstellen Tools: Miniflux und Tiny Tiny RSS – selbst erstellter Online-RSS-Reader.
1. Verwenden Sie Feed43, um RSS einer beliebigen Website zu abonnieren.
Offizielle Website:
- HTTP://feed43.com/
Um auf die Website zuzugreifen, registrieren Sie zunächst ein Konto. Feed43 unterstützt die jederzeitige Verwaltung und Bearbeitung Ihrer eigenen Feeds.
Anschließend können Sie die Websites hinzufügen, die Sie abonnieren möchten. Wenn verstümmelte Zeichen vorhanden sind, geben Sie die folgende Codierung ein: utf-8 oder gbk.
Anschließend gibt Feed43 den HTML-Quellcode der Webseite aus. Geben Sie die Regeln ein, die Sie crawlen möchten, unter Element (wiederholbar) Suchmuster*:. Es gibt zwei Parameter: {%}
und {*}
. {%}
steht für eine Variable, {*}
steht für eine Auslassung. Beachten Sie genau: Wenn wir den Titel übernehmen möchten, kopieren Sie das HTML-Tag des Titels, ersetzen Sie die Variablen und lassen Sie diejenigen weg, die nicht benötigt werden.
Beachten Sie die Regeln der neuesten Artikel auf der Homepage von wzfou.com, die ich gelesen habe, wie unten gezeigt:
Wenn nach dem Klicken auf „Extrahieren“ kein Inhalt vorhanden ist, können Sie mit den einfachsten Tags beginnen, z. B. zuerst nur die H-Tags abrufen und dann weitere Inhalts-Tags hinzufügen. Nach der Bestätigung ist es an der Zeit, die RSS-Vorlage festzulegen, hauptsächlich den Titel, den Inhalt und die Links. Füllen Sie den Inhalt basierend auf dem oben erfassten {%}
aus.
Klicken Sie abschließend auf Vorschau und Sie werden sehen, dass der RSS-Feed erfolgreich erstellt wurde.
Öffnen Sie diese XML-Adresse mit einem Browser und wir können den aktualisierten Inhalt von RSS sehen. Sie können diese RSS-Adresse mit einem RSS-Reader abonnieren.
Selbstverständlich können Sie diesen RSS-Feed auch jederzeit ändern oder löschen.
2. Kostenlose und selbst erstellte RSS-Feed-Volltextlesung
2.1 RSS-Volltext-Abonnement-Online-Website
Solange Sie die RSS-Abonnementadresse angeben, können Sie die folgenden Websites verwenden, um RSS-Volltexte zu abonnieren:
- http://fetch RSS.com
- http://fünf Filter.org
- HTTP://vollständiger Inhalt RSS.com/
- HTTPS://wuwuwu.free full RSS.com/
Unter anderem ist freefullrss völlig kostenlos. Geben Sie Ihre RSS-Abonnementadresse ein.
Anschließend generiert freefullrss den RSS-Volltext.
Über diese Adresse können Sie einen RSS-Reader abonnieren. Im RSS-Reader sehen Sie den vollständigen Text unseres Abonnements. (Klicken um zu vergrößern)
2.2 Selbst erstellter RSS-Volltext-Abonnementdienst
Projektadresse:
- Bitbucket: https://bitbucket.org/fünffilters/full-text-rss
- Github: https://github.com/Dither/full-text-rss
Das Bitbucket-Projekt von Full-Text RSS scheint aktualisiert worden zu sein. Sie können den Git-Klon https://bitbucket.org/fivefilters/full-text-rss.git direkt herunterladen. Volltext-RSS ist nur ein PHP-Programm und erfordert keine Datenbank. Nachdem Sie den Volltext-RSS heruntergeladen haben, dekomprimieren Sie ihn und laden ihn zum Versenden direkt auf den Server hoch.
Öffnen Sie dann die URL und Sie können die Volltext-RSS-Schnittstelle aufrufen und die RSS-Adresse eingeben, unter der Sie den Volltext erhalten möchten.
Nach dem Parsen sehen Sie den vollständigen Text des RSS im Browser.
Volltext-RSS bietet auch die Funktion, das RSS einer beliebigen Website zu crawlen. Allerdings müssen Sie zuerst die Crawling-Regeln formulieren. Die offizielle Website für Volltext-RSS bietet auch Tausende von Website-Regeln, die von Internetnutzern selbst erstellt wurden, und wir können sie direkt verwenden. Der Weg ist:
- Geben Sie das Verzeichnis ein: site_config/standard/
- Löschen Sie alle Inhalte im Verzeichnis
- Führen Sie den Befehl aus:
git clone https://github.com/fünffilters/ftr-site-config.git .
- Git beginnt mit dem Herunterladen der neuesten Site-Konfigurationsdatei
- Wenn Sie aktualisieren möchten, wiederholen Sie einfach den obigen Vorgang oder verwenden Sie
git pull
.
Natürlich können wir auch den online generierten RSS-Feed von Full-Text RSS verwenden: http://createfeed.fünffilters.org/. Geben Sie die Website-Adresse ein, die Sie abonnieren möchten.
Wählen Sie dann die Webseite aus, um den Inhalt zu aktualisieren. Zu diesem Zeitpunkt generiert fivefilters Website-Crawling-Regeln. Sie können einfach darauf klicken, um sie herunterzuladen.
Laden Sie die heruntergeladene Konfigurationsdatei nach site_config/standard/ hoch.
3. IFTTT: Implementieren Sie RSS-E-Mail-Benachrichtigungen und APP-Erinnerungen
Die Kombination aus RSS-Abonnement und IFTTT wird sehr leistungsfähig. IFTTT kann den Inhalt des RSS-Abonnements auf Ihre E-Mail, Ihr Mobiltelefon, Ihren Computer und andere Endgeräte übertragen.
Nachdem Sie die RSS-Abonnementadresse in IFTTT hinzugefügt haben, können Sie Erinnerungen in der mobilen APP erhalten.
Darüber hinaus unterstützt Blogtrottr die Schlüsselwortfilterung und das Pushen von RSS, sodass Sie nur RSS-Abonnementinhalte erhalten, an denen Sie interessiert sind: https://blogtrottr.com/.
4. Zusammenfassung
Feed43 ist ein sehr leistungsfähiges Crawling-Tool, das jede Website abonnieren und in eine RSS-Adresse umwandeln kann. Leider können kostenlose Benutzer sie nur alle 6 Stunden aktualisieren. Kostenlose Volltext-Lesedienste für RSS-Feeds weisen viele Einschränkungen auf und einige Dienste sind noch nicht sehr stabil, daher ist es besser, selbst einen zu erstellen.
Bisher besteht das einzige Problem darin, dass wir hoffen, dass Feed43 nicht abgeschaltet wird. Schließlich handelt es sich um einen kostenlosen Drittanbieterdienst, und RSS befindet sich derzeit nicht in einer Rezession. Der einfachste Weg, eine Website auszugraben, besteht darin, Huginn zu verwenden, um RSS- und WeChat-Aktualisierungen öffentlicher Konten von jeder Website abzurufen und so eine zentrale Plattform zum Lesen von Informationen zu schaffen.