Làm thế nào tôi có thể đọc lại một nguồn cấp RSS từ đầu? [đóng cửa]


7

Nếu tôi chạy trên một webcomic hoặc blog mới mà tôi thực sự thích, tôi đăng ký vào nguồn cấp dữ liệu RSS / Atom của nó để tôi có thể xem nội dung mới. Nếu nó đủ tuyệt vời, tôi cũng muốn đọc tài liệu lưu trữ để bắt kịp tất cả nội dung cũ. Đăng ký rất dễ dàng. Đọc tài liệu lưu trữ là dễ dàng nếu tôi có thể làm tất cả trong một lần ngồi; nếu không thì khó.

Google Reader sẽ là một cách tuyệt vời để đọc qua kho lưu trữ của một trang web, ngoại trừ việc nó sẽ không theo dõi trạng thái đọc / chưa đọc cho bất cứ điều gì cũ hơn một vài tuần. Có điều gì tương tự sẽ cho phép tôi duyệt qua toàn bộ lịch sử của nguồn cấp RSS, theo dõi những bài đăng tôi đã đọc và có một cách đơn giản để đưa tôi đến bài chưa đọc tiếp theo không? (Cũng quan trọng là một cách để đánh dấu một bài đăng là "chưa đọc" một lần nữa, vì tôi có thể không phải lúc nào cũng có thể đọc một bài viết dài hơn trong một lần ngồi.)

Tôi biết rằng nguồn cấp dữ liệu RSS thực tế chỉ chứa mười hoặc hai mươi bài đăng cuối cùng tại bất kỳ thời điểm nào và đó thực sự là một phần của câu hỏi này. Để thực sự hữu ích, một ứng dụng web "đọc-lưu trữ" sẽ phải được gắn vào một cái gì đó giống như Google Reader đã (có thể) đã xem nguồn cấp dữ liệu RSS mãi mãi và do đó sẽ biết tất cả các bài đăng đã từng đi qua nó - hoặc nếu không có một số cách khác để cạo tài liệu lưu trữ của trang web hoặc tìm hiểu về lịch sử của nó.


+1 Tôi có cùng một vấn đề. Điều khá phiền toái là nếu bạn không lưu trữ các mục nhập nguồn cấp dữ liệu cục bộ, chúng sẽ bị mất khi nguồn cấp dữ liệu đạt đến số lượng mục nhập tối đa. Hãy xem liệu ai đó đưa ra một giải pháp tốt
mvime

Câu trả lời:


1

Bạn có thể thực hiện việc này bằng cách liên kết với Way Back Machine nếu tổ chức được lưu trữ trên trang web dưới dạng tệp XML thực tế. Nếu nó được tạo động từ cơ sở dữ liệu (như hầu hết các CMS hiện đại sẽ làm) Tôi nghĩ rằng giải pháp của bạn thực sự cần phải được lắng nghe mãi mãi. Nếu trang web không đặc biệt phổ biến hoặc không hiển thị tốt trong danh sách tìm kiếm, có thể khó tìm thấy các trình thu thập dữ liệu tự động như thế.

Giả sử người xây dựng trang web không tùy chỉnh kiến ​​trúc lưu trữ hoặc lưu trữ trong các CMS họ sử dụng, bạn có khả năng có thể viết một ứng dụng để thu thập dữ liệu và xử lý nội dung của trang web. Bạn có thể phải xây dựng một cái cho mỗi CMS và tôi có thể thấy rằng phải mất khá nhiều thời gian để xử lý. Có lẽ không phải là một lựa chọn thực tế tại thời điểm này.

Hiện tại, tôi nghĩ có lẽ bạn sẽ phải duyệt trang web.

Một số trình đọc nguồn cấp dữ liệu có trình duyệt tích hợp cho phép bạn gắn thẻ các trang và thêm chúng vào danh sách của nguồn cấp dữ liệu. Tôi khá chắc chắn rằng bạn có thể tạo một liên kết tập lệnh để thêm vào thanh dấu trang của trình duyệt để gắn dấu sao cho một trang web ngẫu nhiên trong Google Reader. Và đó cũng là con đường Delicious.com. Vì vậy, ngay cả khi bạn phải duyệt thủ công một trang web, bạn vẫn có thể lưu các bài đăng bạn thực sự thích.


1
Bài viết này: googlesystem.blogspot.com/2007/06/ Cách thuần túy để có phương pháp phục hồi các mục thức ăn cũ. Nếu người dùng Reader không theo dõi nguồn cấp dữ liệu, tôi không nghĩ rằng nó sẽ có các mục nguồn cấp dữ liệu, nhưng nó đáng để thử. Liên kết ví dụ không hoạt động và tôi không thể lấy nó để lấy một vài trang web của riêng mình, nhưng có lẽ nó sẽ hoạt động cho các trang web lớn hơn mà bạn đang cố đọc.
Matt

1
Thật tuyệt - vì vậy Reader có thể (đôi khi) cung cấp cho tôi nguồn cấp dữ liệu Atom của toàn bộ lịch sử. Điều đó trả lời một nửa câu hỏi khó hơn của tôi. Tuy nhiên, vẫn không cho tôi một cách tốt để duyệt qua nó.
Joe White

Sau đó, tôi sẽ lưu nguồn cấp dữ liệu Atom đó vào trình đọc Google, có thể tải toàn bộ lịch sử hoặc thêm nó vào trình đọc nguồn cấp dữ liệu cho máy tính để bàn. Nếu bạn đi theo tuyến trình đọc nguồn cấp dữ liệu (có một số tùy chọn miễn phí tốt cho cả Windows và Apple), bạn sẽ có thể, khi tải nguồn cấp dữ liệu Atom lần đầu tiên, để báo cho nó tải tất cả lịch sử có sẵn.
Matt

và với Google Reader hiện không còn tồn tại và bị xóa, không có lựa chọn nào khác. chỉ nói
silpol

Nói về việc hồi sinh một thây ma. Bạn tìm thấy cái này ở đâu? Tôi tưởng tượng 3 năm sau ai đó có thể đã đưa ra một giải pháp thay thế. Tôi không dành thời gian thực sự với nguồn cấp dữ liệu RSS vì vậy tôi không biết không gian ngày hôm nay. Tôi có thể đi duyệt trang web bây giờ, thẳng thắn.
Matt
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.