Một trang đã bị xóa khỏi Google do DMCA, các liên kết trong của nó có còn giá trị không?


9

Ok đây là những gì tôi tin là một câu hỏi khó:

Vì vậy, bạn có một trang web nơi loại bỏ DMCA được thực hiện đối với một bài đăng nhận được lưu lượng truy cập khổng lồ, việc xóa DMCA có thể đúng hoặc không chính xác nhưng hiện tại tôi không có thời gian cũng không có tài nguyên để chống lại nó.

Câu hỏi của tôi, trang được phát hành loại bỏ DMCA đã bị ẩn khỏi SERPS, NHƯNG bài đăng vẫn còn trên blog của tôi - bởi vì nó đã nhận được một lượng lưu lượng truy cập lớn như vậy, nó đã tạo ra một lượng đáng kể các liên kết ngược chất lượng cao .. .. vì vậy điều gì xảy ra với các liên kết ngược đó, trang vẫn ở trên trang web, nhưng đã bị xóa (ẩn) trong cơ sở dữ liệu google, các liên kết ngược có còn mang trọng lượng không ...?

EDIT 1: Khi thực hiện tìm kiếm google cho liên kết, các mục sau sẽ được hiển thị:

Đáp lại khiếu nại mà chúng tôi đã nhận được theo Đạo luật bản quyền kỹ thuật số thiên niên kỷ của Hoa Kỳ, chúng tôi đã xóa 1 kết quả khỏi trang này. Nếu bạn muốn, bạn có thể đọc khiếu nại DMCA gây ra (các) loại bỏ tại LumenDatabase.org.

EDIT 2 Trang web cũ có bài đăng bắt nguồn từ nhiều tháng nay và vẫn rel canonicalhướng đến bài đăng trên blog của tôi, hiện được phát hành với DMCA ... Tuy nhiên, rel canonicalđã bị bỏ qua kể từ khi được phát hành với DMCA mặc dù rel canonicalvẫn còn hướng về trang web của tôi ... cho những gì đáng giá


Chỉnh sửa thứ hai của bạn làm tôi suy nghĩ (tôi ghét điều đó). Bạn có phải là tác giả ban đầu của bài viết ?? Nếu đó là trường hợp, thì làm thế nào các trang web khác tuyên bố bạn đã đánh cắp nội dung của họ? Một cái gì đó để xem xét.
Closnoc

@closetnoc Tôi đã viết bài đăng, đó là một thỏa thuận kinh doanh nơi đối tác (trước đây) của tôi và tôi có một trang web, chúng tôi đã đồng ý chia tách và tôi đã đưa bài đăng của mình lên trang web mới của mình, anh ấy đồng ý đưa một rel canonicaltrang web mới của tôi cho bài đăng tôi đã viết .... Một vài điều xảy ra trong dòng ngắn gọn - anh ấy nhận thấy bài đăng tôi đã viết (ban đầu được đăng trên tên miền được chia sẻ của chúng tôi), bắt đầu tạo ra một lượng lưu lượng truy cập lớn, anh ấy đã bị chua và nộp DMCA chống lại bài đăng, (Bài đăng đã nhận được hơn 100 nghìn lượt chia sẻ trên mạng xã hội và được đề cập trong một số ấn phẩm chính) Bạn nghĩ đó là đạo văn ... dựa trên lời giải thích ở trên?
Timothy Coetzee

Đạo văn không phải là từ. Tuy nhiên, nếu khiếu nại DMCA sai đã được nộp, tôi sẽ chống lại nó mà không do dự. Đây là "chửi bậy" theo luật. Đó là một tội ác. Giải thích cho họ những gì bạn giải thích cho chúng tôi. Tôi sẽ khuyên bạn nên thuê một luật sư bản quyền để viết một hoặc hai lá thư, một người chấm dứt và hủy bỏ cho đối tác cũ của bạn và người kia trong nỗ lực chống lại điều này. Thư không tốn kém và thường giải quyết vấn đề nhanh. Vì lý do gì, khi một luật sư tham gia, mọi người bắt đầu nghiêm túc. Nó không có nghĩa là một vụ kiện, nó chỉ có nghĩa là ít nhất bạn có thể làm để đảm bảo bạn thắng.
Closnoc

Câu trả lời:


7

Được chứ. Đây sẽ là một trong những trường hợp tôi sẽ làm việc trong suốt quá trình để nó trở nên rõ ràng hơn. Nó sẽ hơi dài, nhưng hy vọng không đau đớn lâu.

Chúng ta hãy bắt đầu từ đầu?

Bắt đầu với những gì chúng ta biết về cách Google hoạt động ban đầu dựa trên tài liệu nghiên cứu của Brin và Page vào năm 1997, chúng tôi biết một số điều mà rất có thể vẫn còn tồn tại cho đến ngày nay.

Google có một URL trong chỉ mục của nó và tìm nạp hàng đợi và tìm nạp trang. Mã cho trang được lưu trữ trong cơ sở dữ liệu của nó cho các hình thức xử lý khác nhau. Một trong những quy trình sẽ là tìm liên kết mới. Bất kỳ liên kết nào được tìm thấy bởi Google sẽ được đặt đầu tiên trong chỉ mục liên kết nếu nó tồn tại. Nếu không, liên kết sẽ được thêm vào bảng liên kết và thêm vào hàng đợi.

Bất kỳ liên kết nào trong bảng liên kết đều có ít nhất các yếu tố này, URL liên kết, URL nguồn và văn bản liên kết. Có khả năng là có các yếu tố dữ liệu khác, tuy nhiên, những yếu tố này không thúc đẩy cuộc thảo luận. Bất kỳ liên kết nào được thêm vào bảng liên kết đều có URL nguồn được xác minh, nhưng không nhất thiết phải là URL mục tiêu. Lấy ví dụ về cơ sở dữ liệu quan hệ, URL nguồn và URL mục tiêu có thể là ID URL trong bảng URL và bảng tham gia sẽ tham gia URL nguồn của bảng liên kết và các thành phần URL mục tiêu bằng cách sử dụng ID trở lại bảng URL. Bối rối? Đừng như vậy.

Đối với bất kỳ trường hợp nào mà trang đích chưa được tìm nạp, liên kết trong bảng liên kết được gọi là liên kết lơ lửng. Khi trang được tìm nạp, liên kết trong bảng liên kết hoàn tất. Nếu trang đích không tồn tại, thì liên kết trong bảng liên kết là một liên kết bị hỏng. Đơn giản?

Chỉ các liên kết hoàn chỉnh có thể vượt qua giá trị. Thuật toán PageRank yêu cầu một liên kết hoàn chỉnh để tính giá trị. Tất cả các liên kết lơ lửng và bị hỏng dừng mọi tính toán bằng liên kết. Trước đây, PR là một quá trình đệ quy sẽ tính toán các giá trị liên kết bằng cách sử dụng bảng liên kết nhiều lần cho đến khi giá trị có thể được điều chỉnh theo bất kỳ liên kết nào nằm trong một giá trị số nhỏ đến mức nó sẽ không tạo ra sự khác biệt. Tôi chắc chắn rằng điều này vẫn xảy ra như là một quá trình giữ nhà. Tuy nhiên, PR ngày nay được tính toán bằng phương pháp khác tương tự như bước nhảy trong mạng đo khoảng cách từ trang này đến trang khác có tầm quan trọng tương đối. Nó dựa trên mô hình mạng tin cậy, đó là cách mô hình PageRank ban đầu được thiết kế để mô phỏng. Một liên kết là một phiếu tín nhiệm từ thực thể này sang thực thể khác. Trong khi nó trở nên phức tạp hơn thế này, Bạn nhận được hình ảnh. Nó thực sự làm điều tương tự như quy trình đệ quy sử dụng phép tính thời gian thực hơn mặc dù có thể ít chính xác hơn nhưng đủ chính xác để đáng tin cậy. Điều này đòi hỏi các liên kết hoàn chỉnh vì các giá trị tin cậy (sử dụng mô hình mạng tin cậy) không thể được thông qua nếu niềm tin không được thiết lập. Hãy nhớ rằng một liên kết là một phiếu tín nhiệm hoặc liên kết trong mô hình mạng tin cậy. PageRank được thể hiện dưới dạng giá trị tin cậy trong mạng tin cậy.

Bây giờ bạn đã hiểu các liên kết và tầm quan trọng của chúng, hãy tiếp tục.

Đối với một công cụ tìm kiếm, sẽ không có ý nghĩa gì khi xóa bất kỳ URL nào. Nếu một URL không tồn tại trong bảng URL, thì bạn không thể biết bất cứ điều gì về URL và sẽ bị mất. Các URL thường không bị xóa trừ khi nó có ý nghĩa, ví dụ, nếu URL không còn tồn tại. Tuy nhiên, khi một trang được đặt thành NOINDEX, thì công cụ tìm kiếm đã được hướng dẫn rõ ràng KHÔNG lập chỉ mục trang. Vì một trang web trong chỉ mục bao gồm hai thứ, một URL và mã nguồn HTML, NOINDEX sẽ xóa trang một cách hiệu quả vào thời điểm này. Liên kết đến một trang NOINDEX ít nhất là lơ lửng.

Bây giờ bạn đã biết một trang được lập chỉ mục trông như thế nào, hãy di chuyển xa hơn.

Có nhiều cách mà một công cụ tìm kiếm sẽ xử phạt một trang web hoặc trang web. Một là hủy bỏ niêm yết. Đây là hình phạt nặng nhất trong tất cả các hình phạt và mất nhiều thời gian để phục hồi. Thể loại hình phạt này bạn có thể làm bằng chứng vì trang sẽ không và không thể được tìm thấy. Đồng thời, Googles Search Console cũng sẽ thông báo cho bạn biết rằng các trang đang bị hủy bỏ. Trong số các hình phạt còn lại, các hình phạt được áp dụng trong các bộ lọc SERP.

Khi một truy vấn tìm kiếm được thực hiện, thực tế có một số truy vấn đối với chỉ mục cùng một lúc sau đó được trộn vào một tập kết quả dựa trên một phần của thuật toán. Thuật toán còn lại, mà chúng ta thường đề cập đến như một thực thể duy nhất, là một loạt các thuật toán SERP tương đối đơn giản. Các thuật toán chính sẽ sắp xếp lại tập kết quả dựa trên các số liệu thời gian thực hơn như xu hướng. Trong số các thuật toán, những thuật toán loại bỏ các mục khỏi tập kết quả hoặc hạ cấp nghiêm trọng vị trí của một mục trong tập kết quả được gọi là các bộ lọc. Một bộ lọc được áp dụng là bộ lọc xử lý DMCA như được chứng minh bằng...we have removed 1 result(s) from this page...

Vì vậy, bây giờ bạn đã biết cách áp dụng hình phạt, các liên kết, PR và bộ lọc DMCA được kết nối?

Với điều này, chúng tôi biết một bộ lọc đã được áp dụng, tuy nhiên, điều này không liên quan gì đến chỉ mục liên kết, đó là cách tính toán của PageRank. Nó được loại bỏ khỏi quá trình liên kết / PR như nó có thể nhận được. Liên kết và PR là ở phần đầu của quá trình lập chỉ mục trong khi loại bỏ trang bị phạt DMCA là ở cuối quá trình truy vấn. Trên thực tế, đây là hai động cơ hoàn toàn riêng biệt. Vì vậy, trong khi một trang có thể bị xóa do khiếu nại DMCA, thì nó không thực sự bị xóa khỏi chỉ mục và do đó các liên kết đến và từ trang vẫn được tính toán.

Rõ như bùn? Tôi hy vọng rằng tôi đã giải thích điều này tốt. Xin vui lòng cho tôi biết nếu tôi có thể làm rõ một cái gì đó cho bạn.

[Cập nhật]

Một ngoại lệ không áp dụng cho kịch bản của OP.

@StephenOstermiller mang đến một điểm tốt mà không làm suy yếu những điều trên, tuy nhiên, tôi muốn thêm nó cho đầy đủ.

Như bạn đã biết, việc ghi một trang web hoặc trang trong tìm kiếm đòi hỏi nhiều yếu tố. Mặc dù điều này không phải là kỹ thuật hoặc thần bí như bạn có thể tưởng tượng, nó vẫn còn rất nhiều hoặc yếu tố để cân nhắc. Tôi quên mất ảnh hưởng của điểm tin cậy chủ yếu là vì nó không được áp dụng trong trường hợp của OP. Vì vậy, tôi đang thêm nó ở đây.

Rõ ràng có những trang web không tốt như các trang web spam. Trong phân loại các trang web này là các trang web thường xuyên lạm dụng nội dung bản quyền. Đây là một vấn đề lớn trong nhiều năm trước, nơi những người dọn dẹp nội dung sẽ xây dựng các trang web từ công việc khó khăn của bạn. Trong một thời gian dài, không có gì được thực hiện. Các trang web có nội dung ban đầu sẽ thua các trang web cạp khá nhất quán. Tôi nên biết. Tôi đã có hai trang web PR 8 bị mất gần như toàn bộ lưu lượng truy cập do các trang web cào mà hoàn toàn không có sự truy đòi.

Tuy nhiên mọi thứ đã thay đổi. Và nó chỉ mới được khoảng bốn năm kể từ khi những thay đổi đáng kể đã bắt đầu.

Đối với các phân loại đặc biệt của các trang web, điểm tin cậy của các trang web có thể được giảm đáng kể. Điều này là nổi tiếng. Phải mất nhiều năm để xây dựng lại điểm tin cậy và đối với một số trang web, điều này có thể không bao giờ xảy ra. Ví dụ, tại sao bạn nghĩ rằng những người kiếm tiền từ miền sẵn sàng dọn rác triệt để một trang web với hàng trăm ngàn người đang chờ đợi trong cùng một vụ lạm dụng? Đó là bởi vì thực tế là một miền có thể phá hỏng giá trị của nó vượt quá sự cứu chuộc.

Có nhiều yếu tố đi vào việc thiết lập niềm tin. Tôi sẽ không nhận được ở đây. Tuy nhiên, phải biết rằng niềm tin là một thành phần chính của việc xây dựng thứ hạng cho bất kỳ trang web nào.

Điều đó nói rằng, đối với bất kỳ trang web nào là người vi phạm nghiêm trọng DMCA với hồ sơ theo dõi khá rộng rãi, sẽ thấy một cú đánh nghiêm trọng vào điểm tin cậy của nó. Đây không phải là kịch bản mà OP đang mô tả. Tuy nhiên, đó là kịch bản tôi đang giả định ở đây.

Liên kết và thiết lập PageRank có nhiều hơn một thành phần. Một là PageRank (quyền) của chính trang đó. Đối với các trang có thẩm quyền cao, có một giới hạn thẩm quyền. Một trang PR 8 sẽ không chia sẻ giá trị 8 trong số các liên kết trên trang đó. Đây là một phần của thuật toán PageRank ban đầu nhằm đưa đường cong tự nhiên hơn vào PR. Nếu không, gần như không thể để một trang mới cạnh tranh với một trang có thẩm quyền cao ngay cả sau một thời gian dài. Giá trị của chính liên kết được ghi bằng một số yếu tố bao gồm giá trị ngữ nghĩa của văn bản liên kết, URL liên kết, vị trí của liên kết (nổi bật), giá trị ngữ nghĩa của khối nội dung có chứa liên kết nếu được áp dụng, v.v. được tính điểm từ 0 đến 0,9. Việc tính toán thẩm quyền và điểm liên kết là giá trị được thông qua bởi bất kỳ liên kết nào.

Tốt và tốt. Vậy làm thế nào để điều này ảnh hưởng đến một trang web là một người vi phạm đáng kể của DMCA?

Giá trị của bất kỳ liên kết trong nước nào sẽ không nhất thiết bị ảnh hưởng bởi điểm tin cậy của trang đích vì giá trị liên kết đến từ trang nguồn. Tuy nhiên, bất kỳ liên kết ngoài có thể được. Quyền hạn của bất kỳ trang web nào là kẻ lạm dụng DMCA đáng kể sẽ bị ảnh hưởng bởi điểm tin cậy. Sau tất cả, thẩm quyền đến từ sự tin tưởng. Vì vậy, theo cách này, giá trị của một liên kết trong sẽ không được chuyển qua các liên kết ngoài mà không bị suy giảm tùy thuộc vào điểm số tin cậy.

Điều này thay đổi câu trả lời phần nào.

Mặc dù nó không áp dụng cho kịch bản của OP, nhưng có một kịch bản trong đó giá trị liên kết trong không hoàn toàn được chuyển qua trang web có vi phạm DMCA. Tuy nhiên, đây là một trường hợp khó khăn và do đó ngưỡng trước khi điều này xảy ra là rất đáng kể.


cảm ơn bạn rất nhiều vì câu trả lời chi tiết này ... Tôi sẽ mở nó thêm vài ngày nữa để xem những gì khác có thể xảy ra ... Tôi sẽ nghiên cứu thêm một chút và sẽ bật cho bạn một vài câu hỏi trước khi tôi chấp nhận câu trả lời một hoặc hai ngày tới nếu điều đó ổn - một lần nữa cảm ơn bạn đã dành thời gian để viết tất cả những điều này
Timothy Coetzee

Google lặp lại các yêu cầu DMCA để trở thành một yếu tố xếp hạng: searchengineland.com/. Thuật toán đó nhắm vào nhiều yêu cầu DMCA thay vì chỉ một yêu cầu như trong trường hợp của câu hỏi này. Có thể các liên kết phá giá đến các trang bị chặn DMCA có thể là một phần của bản cập nhật thuật toán đó. Như với hầu hết mọi thứ, Google không nói. Tôi cũng không biết một cách tốt để kiểm tra nó.
Stephen Ostermiller

Nhưng tôi đồng ý với Closnoc rằng Google sẽ phải viết mã để phá giá cụ thể các liên kết đó vì DMCA phù hợp với quy trình lập chỉ mục.
Stephen Ostermiller

@StephenOstermiller Có. Tôi quên mất điều này. Về cơ bản, công cụ chỉ mục thiết lập các số liệu xếp hạng bao gồm các liên kết với số liệu miền và tin cậy trong khi các thực thể khác có thể hạ cấp bậc. Bộ lọc SERP là động. Những gì được đề cập trong bài viết dường như là cả một phạm trù vi phạm dai dẳng làm giảm thứ hạng tin cậy của các trang web. Nếu một trang web nhận được sự tin tưởng, rất khó để lấy lại. Nó có thể mất nhiều năm. Thứ hạng tin cậy của các trang web có thể ảnh hưởng đến giá trị của liên kết ngoài. Khi có nhiều caffein hơn, tôi sẽ xem liệu tôi có thể hiểu điều này trong câu trả lời không. Cảm ơn đã đưa ra vấn đề này! Chúc mừng !!
Closnoc

@StephenOstermiller Phần tôi phải suy nghĩ về là liệu số điểm tín nhiệm sẽ ảnh hưởng đến giá trị của một liên kết ngoài. Tôi sẽ tưởng tượng như vậy, nhưng không chắc nó sẽ hoạt động như thế nào. Tôi sẽ phải suy nghĩ về điều này một chút. Nó chắc chắn sẽ không ảnh hưởng đến giá trị của một liên kết trong nước mà tôi có thể thấy. Ant là phần ảnh hưởng đến OP.
Closnoc

2

HAHA Tôi nghĩ rằng tôi thực sự, đầy đủ, hiểu câu hỏi này ngay bây giờ: /

Chính BẠN đã được gửi thông báo, liên kết đến trang web CỦA BẠN bị ẩn trong tìm kiếm GOOGLE, FILE vẫn ở trên trang của BẠN và có rất nhiều LIÊN KẾT KHÁC chỉ vào trang web CỦA BẠN và các liên kết THOSE mang trọng lượng đến trang web CỦA BẠN khi hiển thị trên GOOGLE liên kết đến trang web CỦA BẠN VÀ LIÊN KẾT có thông tin thông báo OMITTED ở cuối tìm kiếm của Google. : P Tôi có đúng không?

Trong điều đó -

Câu trả lời ban đầu của tôi sẽ giúp ích rất nhiều cho những người nộp thông báo gỡ xuống DMCA OH! -trống cuộn

Vì vậy, đây là câu trả lời của tôi: Không và địa ngục KHÔNG!

Những liên kết cụ thể đó, về cơ bản là không đáng tin cậy và bạn nên lo ngại rằng chúng vẫn liên kết đến trang web của bạn. Bạn cũng có thể thực hiện di chuyển chối bỏ và bảo vệ chính mình. Cho thật.

Hơn nữa, chủ sở hữu trang web khác nên quan tâm hơn và tại sao việc kiểm tra các liên kết ngược của bạn có thể rất quan trọng. Một lịch sử của loại liên kết này nơi tác giả đang đăng các loại liên kết này sẽ có tác động xấu đến chúng.

Bạn có thể xem xét để cho những người khác biết rằng họ có các liên kết nội dung xấu chỉ vào BẠN và có thể làm tổn thương THEM.

Thành thật mà nói, loại nội dung đó không có giá trị cho bạn hoặc họ và bạn không bao giờ nên dựa vào các loại liên kết đó để có lợi cho SEO của bạn.

Quyết định ngắn hạn có thể có tác dụng dài hạn.

Tôi đã tự hỏi tại sao bạn tiếp tục rò rỉ thông tin một chút.


1
Cảm ơn sự đóng góp của bạn ... Xin vui lòng xem câu trả lời @closetnoc, tôi tin rằng đó là một mô tả chi tiết và chính xác hơn, tôi không nghĩ bạn nên sử dụng từ chối trong trường hợp như vậy. Và tôi chắc chắn sẽ không mô tả các liên kết là không đáng tin cậy đến từ các trang PR8 + như TheIrishTimes, nzherald ...? Ngoài ra, hãy nhớ rằng tên miền mà bài đăng có nguồn gốc vẫn đang trỏ rel canonicalđến trang web của tôi mặc dù nó không còn được vinh danh vì thông báo DMCA ...
Timothy Coetzee

1

Câu hỏi thú vị. Theo tôi, sẽ không có vốn chủ sở hữu nào được chuyển qua các liên kết ngược vì trang sẽ không được Google thu thập hoặc lập chỉ mục vì nó đã bị xóa khỏi cơ sở dữ liệu của nó. Tôi tin rằng Google vẫn thu thập dữ liệu các trang web không được lập chỉ mục, tuy nhiên, tôi không chắc liệu điều này có khác không khi một trang đã bị xóa khỏi cơ sở dữ liệu của Google ngay cả khi nó vẫn còn trên trang web.


Bạn hoàn toàn chính xác. Liên kết sẽ là một liên kết lơ lửng, không phải là một liên kết bị hỏng và không có giá trị nào thực sự có thể được thông qua vì trang sẽ không tồn tại trong chỉ mục. Điều này bao gồm các liên kết từ trang không được lập chỉ mục. Một số người nói rằng các trang này tồn tại ngay cả khi nó không hiển thị trong SERPs để các liên kết có thể được tính toán. Điều này có thể đúng một phần. Chỉ vì một trang không được lập chỉ mục không có nghĩa là trang đó không được tìm nạp và các liên kết không được tính toán. Điều này vẫn có thể. Tuy nhiên, tôi cho rằng G không làm việc chăm chỉ và có thể sống với sự phá vỡ chuỗi. Lên tranh luận.
Closnoc

Nhìn trang này chắc chắn tồn tại và Googles biết về nó vì nếu bạn thực hiện tìm kiếm chính xác bạn sẽ nhận được, vì In response to a complaint that we received under the US Digital Millennium Copyright Act, we have removed 1 result(s) from this page. If you wish, you may read the DMCA complaint that caused the removal(s) at LumenDatabase.org.vậy google biết về nó, vì vậy không phải là các liên kết có thể mang trọng lượng ....?
Timothy Coetzee

1
@TimothyCoetzee Nếu bạn có thể tìm thấy trang trong SERPs thì có số lượng liên kết. ... chúng tôi đã xóa 1 kết quả khỏi trang này ... là một gợi ý. Đây là bộ lọc SERP vì vậy có trang tồn tại và các liên kết được tính. Chúc mừng !!
Closnoc

1
Tại sao trang không được thu thập thông tin? Tôi sẽ không mong đợi Google ngừng thu thập nội dung đã bị xóa khỏi công cụ tìm kiếm của họ do DMCA.
Stephen Ostermiller
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.