Lần trước, tôi đã chia sẻ cách sử dụng Huginn để nắm bắt các cập nhật tài khoản công khai RSS và WeChat của bất kỳ trang web nào. Nhiều bạn bè đã để lại tin nhắn nói rằng Huginn quá khó định cấu hình và không có thư viện kịch bản tạo sẵn cần phải có. được tự mình khám phá và tùy chỉnh. Định nghĩa tương đối khó. Điều quan trọng nhất là để xây dựng Huginn, bạn cần phải tự trả phí lưu trữ.
Feed43 mà tôi chia sẻ hôm nay tương đương với chức năng đăng ký và thu thập thông tin RSS của Huginn. Huginn có các chức năng mạnh mẽ. Nếu bạn chỉ muốn sử dụng đăng ký RSS của Huginn, bạn cũng có thể chuyển sang Feed43, một dịch vụ trực tuyến miễn phí có thể đăng ký nhận các bản cập nhật từ bất kỳ trang web nào. Bất kể bạn đang sử dụng một trang web hay không, chỉ những trang web có thể truy cập bằng trình duyệt mới có thể đăng ký Feed43.
Feed43 có gói miễn phí và được thu thập dữ liệu 6 giờ một lần, vì vậy Feed43 không phù hợp để đăng ký các trang web cập nhật thường xuyên. Feed43 có thể tạo nguồn cấp dữ liệu RSS từ bất kỳ trang web nào và sau đó bạn có thể đặt nguồn cấp dữ liệu này vào trình đọc RSS của riêng mình hoặc bạn cũng có thể hợp tác với iFTTT, fivefilters và freefullrss để đạt được khả năng đọc toàn văn RSS, thông báo qua email và lời nhắc trên ỨNG DỤNG di động.
Để biết thêm các công cụ thiết thực, bạn cũng có thể xem:
- Ba công cụ lệnh Rsync, SCP và Tar-quick giải pháp di chuyển trang web và đồng bộ hóa dữ liệu từ xa VPS
- Sử dụng Huginn để nắm bắt các cập nhật tài khoản công khai RSS và WeChat từ bất kỳ trang web nào - tạo nền tảng đọc thông tin một cửa
- Ba công cụ miễn phí giúp bạn phát hiện tính xác thực của máy chủ VPS - Phương pháp kiểm tra tốc độ và hiệu suất máy chủ VPS
PS: Cập nhật vào ngày 31 tháng 1 năm 2018 Ngoài việc sử dụng dịch vụ đăng ký RSS của bên thứ ba, những người bạn có máy chủ hoặc máy chủ riêng cũng có thể xây dựng trình đọc RSS của riêng mình. công cụ: Trình đọc RSS trực tuyến Miniflux và Tiny Tiny RSS tự xây dựng.
1. Sử dụng Feed43 để đăng ký RSS của bất kỳ trang web nào.
Trang web chính thức:
- HTTP://feed43.com/
Để vào website, trước tiên hãy đăng ký tài khoản. Feed43 hỗ trợ quản lý và chỉnh sửa các nguồn cấp dữ liệu của riêng bạn bất cứ lúc nào.
Sau đó, bạn có thể thêm các trang web bạn muốn đăng ký. Nếu có các ký tự bị cắt xén, hãy điền vào Mã hóa sau: utf-8 hoặc gbk.
Sau đó Feed43 sẽ xuất ra mã nguồn Html của trang web. Điền các quy tắc bạn muốn thu thập thông tin tại Mẫu tìm kiếm Mục (lặp lại)*:. Có hai tham số: {%
và {*
. {%
đại diện cho một biến, {*
đại diện cho thiếu sót. Quan sát kỹ, muốn lấy tiêu đề thì copy thẻ Html của tiêu đề, thay thế các biến, bỏ đi những biến không cần thiết.
Tham khảo thể lệ các bài viết mới nhất trên trang chủ wzfou.com mà mình đã lấy như hình bên dưới:
Nếu không có nội dung sau khi nhấp vào Trích xuất, bạn có thể bắt đầu với các thẻ đơn giản nhất, chẳng hạn như chỉ lấy thẻ H trước, sau đó thêm các thẻ nội dung khác. Sau khi xác nhận, đã đến lúc xác định mẫu RSS, chủ yếu là tiêu đề, nội dung và liên kết. Điền nội dung dựa trên {%
được chụp ở trên.
Cuối cùng nhấn Preview và bạn có thể thấy nguồn cấp RSS đã được tạo thành công.
Mở địa chỉ .xml này bằng trình duyệt và chúng ta có thể xem nội dung cập nhật của RSS. Bạn có thể đăng ký địa chỉ RSS này bằng trình đọc RSS.
Tất nhiên, bạn cũng có thể sửa đổi hoặc xóa nguồn cấp RSS này bất kỳ lúc nào.
2. Đọc toàn văn RSS Feed miễn phí và tự tạo
2.1 Trang web trực tuyến đăng ký toàn văn RSS
Chỉ cần bạn điền địa chỉ đăng ký RSS, bạn có thể sử dụng các trang web sau để đăng ký RSS toàn văn:
- http://tìm nạp RSS.com
- http://năm bộ lọc.org
- HTTP://nội dung đầy đủ RSS.com/
- HTTPS://wuwuwu.RSS.com đầy đủ miễn phí/
Trong số đó, freefullrss hoàn toàn miễn phí, hãy nhập địa chỉ đăng ký RSS của bạn.
Sau đó, freefullrss sẽ tạo ra toàn văn RSS.
Bạn có thể sử dụng địa chỉ này để đăng ký một trình đọc RSS. Những gì bạn nhìn thấy trong trình đọc RSS là toàn bộ nội dung đăng ký của chúng tôi. (Bấm vào để phóng to)
2.2 Dịch vụ đăng ký RSS toàn văn tự tạo
địa chỉ dự án:
- bitbucket: https://bitbucket.org/yearfilters/full-text-rss
- Github: https://github.com/Dither/full-text-rss
Dự án bitbucket của RSS toàn văn bản dường như đã được cập nhật. Bạn có thể trực tiếp sử dụng git clone https://bitbucket.org/yearfilters/full-text-rss.git để tải xuống bản mới nhất. RSS toàn văn chỉ là một chương trình PHP và không yêu cầu cơ sở dữ liệu. Vì vậy, sau khi tải xuống RSS toàn văn, hãy giải nén nó và tải trực tiếp lên máy chủ để gửi.
Sau đó, mở URL và bạn có thể vào giao diện RSS toàn văn và nhập địa chỉ RSS nơi bạn muốn lấy toàn văn.
Sau khi phân tích cú pháp, bạn sẽ thấy toàn bộ nội dung RSS trên trình duyệt.
RSS toàn văn cũng cung cấp chức năng thu thập dữ liệu RSS của bất kỳ trang web nào. Tuy nhiên, trước tiên bạn cần xây dựng các quy tắc thu thập thông tin. Trang web chính thức RSS toàn văn cũng cung cấp hàng nghìn quy tắc trang web do chính cư dân mạng đưa ra. Một số bằng tiếng Trung Quốc và chúng tôi có thể sử dụng chúng trực tiếp. cách là:
- Nhập thư mục: site_config/standard/
- Xóa tất cả nội dung trong thư mục
- Thực thi lệnh:
git clone https://github.com/yearfilters/ftr-site-config.git .
- Git sẽ bắt đầu tải xuống tệp cấu hình trang web mới nhất
- Nếu bạn muốn cập nhật, chỉ cần lặp lại thao tác trên hoặc bạn có thể sử dụng
git pull
.
Tất nhiên, chúng ta cũng có thể sử dụng nguồn cấp dữ liệu RSS được tạo trực tuyến do Full-Text RSS cung cấp: http://createfeed.yearfilters.org/, nhập địa chỉ trang web bạn muốn đăng ký.
Sau đó chọn trang web để cập nhật nội dung. Lúc này, fivefilters sẽ tạo ra các quy tắc thu thập dữ liệu trang web. Bạn chỉ cần nhấp vào để tải xuống.
Tải tệp cấu hình đã tải xuống lên site_config/standard/.
3. IFTTT: Triển khai thông báo email RSS và lời nhắc APP
Sự kết hợp giữa đăng ký RSS và IFTTT sẽ trở nên rất mạnh mẽ có thể đẩy nội dung đăng ký RSS tới email, điện thoại di động, máy tính và các thiết bị đầu cuối khác của bạn.
Sau khi thêm địa chỉ đăng ký RSS vào IFTTT, bạn có thể nhận được lời nhắc trong ỨNG DỤNG di động.
Ngoài ra, Blogtrottr hỗ trợ lọc từ khóa và đẩy RSS nên bạn sẽ chỉ nhận được nội dung đăng ký RSS mà bạn quan tâm: https://blogtrottr.com/.
4. Tóm tắt
Feed43 là một công cụ thu thập thông tin rất mạnh mẽ có thể đăng ký bất kỳ trang web nào và chuyển đổi nó thành địa chỉ RSS. Thật không may, người dùng miễn phí chỉ có thể cập nhật nó sau mỗi 6 giờ. Các dịch vụ đọc toàn văn RSS Feed miễn phí có nhiều hạn chế và một số dịch vụ chưa ổn định lắm, vì vậy tốt hơn hết bạn nên tự xây dựng một dịch vụ.
Cho đến nay, vấn đề duy nhất là chúng tôi hy vọng Feed43 không ngừng hoạt động. Xét cho cùng, đây là dịch vụ miễn phí của bên thứ ba và RSS hiện không bị suy thoái. Cách duy nhất để tìm hiểu một trang web là sử dụng Huginn để lấy các bản cập nhật tài khoản công khai RSS và WeChat từ bất kỳ trang web nào - tạo nền tảng đọc thông tin một cửa.