Đau buồn để đánh cắp pagerank khỏi trang web của tôi?


8

Hôm nay tôi đã tìm kiếm các công cụ Google Webmaster cho trang web của mình và thấy các tiêu đề trùng lặp cho các trang sau trên trang web của tôi (mẫu nhỏ trong số nhiều trang trong chỉ mục trang web của tôi):

/?title=3_Misconceptions_Regarding_Traumatic_Human_brain_Injury365
/?title=3_or_more_Misguided_beliefs_Pertaining_to_Disturbing_Head_Incidents2902384
/?title=A_Listing_Of_Successful_Web_Marketing_Tips_For_EveryoneHelpful_Online_Marketing_Methods_For_Easy_Success
/?title=Adhere_to_This_kind_of_Online_marketing_Guidance_To_develop_Your_Business

Đây chắc chắn không phải là những trang tôi đã tạo ra!

Tôi cũng đã xem xét dữ liệu có cấu trúc của mình mà tôi đã tạo trên trang web của mình và tôi có thể thấy dữ liệu này (mẫu nhỏ trong số nhiều):

Structured Data > __sid=11 (Markup: kualalumpur.yalwa.my)
Structured Data > __sid=7 (Markup: www.locanto.cn)

Không ai trong số này là kết quả của một cái gì đó tôi đã làm. Đó rõ ràng là một kế hoạch đau buồn hoặc công phu để đánh cắp pagerank.

Hôm qua tôi đã cài đặt php tự động chuyển hướng 301 và canonical trên tất cả các trang của mình để cố gắng cải thiện điều này (nhờ một số trợ giúp tuyệt vời từ người tràn stack). Nhưng tôi muốn hiểu thêm về điều này và mục tiêu của họ là gì.


1
Mặc dù bạn chưa tạo tiêu đề trang là những trang mà bạn đã tạo? Bạn có cho phép mọi người tạo các trang trên trang web của bạn không? Hãy cho chúng tôi biết thêm về trang web được đề cập vì tại thời điểm này, bất kỳ ai cũng đoán được. Nó có thể là phần mềm độc hại, nó có thể là hệ thống quản lý nội dung của bạn cung cấp nhiều url với các tiêu đề khác nhau, đó có thể là những người đang cố gắng làm tổn thương danh tiếng của bạn (Tâm trí nghi ngờ). Vui lòng chỉnh sửa câu hỏi của bạn và cung cấp cho chúng tôi ý tưởng tốt hơn về trang web bạn chạy, với các điểm chính tôi đã đề cập, cũng là một URL đến trang web được đề cập đi một chặng đường dài về các chủ đề như vậy.
Simon Hayter

Đây không phải là những trang tôi đã tạo. Mặc dù vậy, tôi nhận thấy rằng với wiki của tôi có một trang được đưa ra để thể hiện các trang không được xử lý và không có lỗi 404 nào được phục vụ
Amy Neville

Các công cụ dữ liệu có cấu trúc là hoàn toàn kỳ lạ mặc dù tôi không biết nơi nào có thể đến từ đó.
Amy Neville

1
Xin chào Amy, nghĩ rằng tôi đã nhận được và mặc dù một số công việc điều tra tôi nghĩ rằng tôi có câu trả lời cho bạn, mặc dù bạn có thể không thích nó;)
Simon Hayter

1
Xin chào, tôi làm việc với nhóm Công cụ quản trị trang web của Google. Đây là một vấn đề về phía chúng tôi chỉ ảnh hưởng đến công cụ Kiểm tra dữ liệu có cấu trúc & bảng điều khiển thích hợp trong Công cụ quản trị trang web. Nó không ảnh hưởng đến tìm kiếm trên web và điều này có thể không thực sự là thứ được tìm thấy trên trang web của bạn. Xin lỗi vì sự nhầm lẫn!
John Mueller

Câu trả lời:


6

Một số cách các trang không tồn tại kết thúc trong Chỉ mục của Google

Có 3 cách mà các trang không tồn tại có thể kết thúc trên Google hoặc bất kỳ công cụ tìm kiếm nào khác cho vấn đề đó và đó là:

  • Các trang của bạn đang liên kết đến các trang này. (Điều này có thể có trong sơ đồ trang web, trang hồ sơ, nhận xét blog hoặc a href dựa trên liên kết ...) Tôi đã thấy một số plugin từ WordPress có chứa các liên kết đó vì chúng đã được phát triển trên một trang web và sau đó được tải lên thư viện plugin nhưng nhà phát triển có một thiết lập bộ đệm đã đi kèm với plugin.

  • Một backlink đang trỏ đến những trang này.

  • Tôi đã thấy các trang và chuỗi chỉ mục của Google đơn giản là không tồn tại, mặc dù các trang của bạn dường như có những từ mà tôi không thấy Googlebot có thể đưa ra chúng như thế nào.

Liên kết nội bộ

Bây giờ rất có thể là một liên kết nội bộ của một số loại vì tôi là trang tiêu đề của bạn và tất cả những gì tôi tìm thấy là 3 trang, Pro Webmaster, một trang web khác có hình ảnh trang web này và của bạn. Vì vậy, có vẻ như ai đó đã tạo liên kết này hoặc ứng dụng / plugin / phần mềm độc hại có.

Điều tra

Vì vậy, để loại trừ rằng người dùng, chính bạn hoặc ứng dụng của bạn đã tạo các liên kết này, những gì bạn cần làm là đăng nhập vào SQL (lý tưởng là PHPMyadmin) và tìm kiếm các chuỗi .. Đảm bảo rằng cơ sở dữ liệu sạch các trang này .. Sau đó, giả sử bạn không nhận được thời gian để tìm kiếm các tệp bộ đệm và các tệp php cho các trang này. Nếu bạn không tìm thấy gì thì có khả năng là do ai đó đã liên kết với bạn và bây giờ không phải trên Google vì nó đã bị xóa.

Chuyển hướng /?chuỗi có thể gây hại nếu ai đó ra ngoài để lấy ya

Bây giờ tôi có thể thấy bạn đã xóa tất cả các /?title=chuỗi và chuyển hướng chúng đến trang chủ, trong khi đây là một việc nên làm, nó cũng có thể gây hại cùng một lúc và tôi sẽ giải thích ..

Nếu ai đó đang spam trang web của bạn với các liên kết ngược khó chịu, điều tồi tệ nhất bạn có thể làm là bắt đầu chuyển hướng họ đến trang chủ, vì Google có thể xem đây là thao tác của pagerank. Điều này là do 301 chuyển hướng dòng nước ép từ liên kết bên ngoài, nếu liên kết đó xảy ra là một trang web Viagra thì việc bạn đưa ra một dấu hiệu sai cho Google về chuyển hướng và điều này có thể quay lại và cắn bạn.

Phải yêu những 404 cũ

Điều đúng đắn cần làm trên các trang đơn giản là không tồn tại là sử dụng 404, đây là những điều hoàn toàn bình thường và không có cách nào mang lại cho Google ấn tượng trang web của bạn bị hỏng. Bất kỳ trang nào không tồn tại sẽ không bao giờ kết thúc trong chỉ mục của Google và bất kỳ ai quay lại liên kết đến các trang không tồn tại sẽ không gây hại cho trang web của bạn nếu 404 được trả lại, tuy nhiên như đã đề cập đến 301 cho trang chủ 'MIGHT' vì nó giữ lại nước ép.

1-2 năm trước tôi sẽ nói chuyển hướng chuỗi là phương pháp tốt nhất nhưng kể từ khi Panda Panda và cập nhật Penguin tôi đã thấy các trang web cố gắng làm hỏng danh tiếng trực tuyến (Về cơ bản Panda, Penguin trừng phạt các trang web vì liên kết ngược spam, liên kết phải trả tiền và nói chung là các liên kết không liên quan) Mặc dù Google tuyên bố rằng không thể làm tổn hại danh tiếng của những người khác trực tuyến, nhưng nó đặt ra câu hỏi nếu điều này là đúng tại sao nhiều người hiện đang spam người khác và làm thế nào họ biết rằng đó không phải là quản trị trang web cố gắng điều khiển thứ hạng của riêng họ ? một khu vực gây tranh cãi nhưng chúng ta hãy giải quyết vấn đề này ... Tôi tin rằng 404 sẽ phù hợp với bạn nhất trong tình huống này.

Chỉnh sửa truy vấn phải là foward thẳng, thay vì chuyển hướng để /loại bỏ chuỗi sau đó 301 đến /404/.


sẽ không để tôi bỏ phiếu nhưng đó là một câu trả lời tuyệt vời cảm ơn
Amy Neville

Không có vấn đề gì cả, bây giờ hãy nhận Bùa may mắn trên tất cả các bảng quảng cáo của bạn;)
Simon Hayter

@SimonHayter Google có nhận phản hồi HTTP HTTP và bỏ qua nội dung trang không? Bạn nghĩ gì về một trang 404 thực hiện chuyển hướng javascript đến trang chủ? Chỉ tò mò về những hàm ý
Jonathan
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.