Thật không may, những gì bạn đang cố gắng làm thường được tán thành trong hầu hết các cộng đồng. Những gì tôi nghe bạn yêu cầu là:
- Một cách để truy xuất từ xa nhiều hơn số lượng mặc định (bài viết gần đây)
- Có thể lấy tất cả các bài đăng được xuất bản cho một trang web
- Không có bất kỳ tương tác trực tiếp nào với chính trang web (sử dụng RSS)
Đây là một thực tế thường được sử dụng để cạo nội dung từ blog và xuất bản lại mà không có sự cho phép của tác giả ban đầu. Đó là lý do tại sao tôi nói nó thường cau mày. Hầu hết các tác giả blog dành rất nhiều thời gian và năng lượng để phát triển nội dung tuyệt vời, do đó, việc giúp bên thứ ba dễ dàng tận dụng công việc khó khăn của họ để thêm tín dụng SEO vào trang web của riêng họ là ... tốt ...
Điều đó nói rằng, tôi sẽ cho rằng hiện tại bạn có lý do chính đáng để loại bỏ nội dung từ hơn 700 trang web. Trong trường hợp đó, tôi muốn giới thiệu một phương pháp lập trình riêng biệt - không phải RSS. Nếu bạn có thông tin đăng nhập hợp pháp cho tất cả các trang web này (tức là chúng là trang web của bạn chứ không phải của người khác), bạn có thể sử dụng các tính năng XML-RPC tích hợp của WordPress để tìm nạp nội dung.
Sử dụng thư viện XML-RPC tích hợp để chuyển yêu cầu metaWeblog.getRecentPosts
chỉ định ID của blog (thường là 0 cho các trang web đơn lẻ, nhưng có thể khác nhau trong nhiều trang web), tên người dùng WordPress, mật khẩu WordPress của bạn và số lượng bài đăng để tìm nạp (đặt cái này thành -1 để nhận tất cả).
Trang web khác sẽ phản hồi với tệp XML (khá lớn) có chứa nội dung mà bạn có thể làm với những gì bạn muốn. Tất cả điều này có thể xảy ra đằng sau hậu trường và metaWeblog.getRecentPosts
yêu cầu sẽ cung cấp cho bạn nhiều thông tin hơn nguồn cấp RSS (bao gồm các trường tùy chỉnh, có thể quan trọng đối với bạn).