Bạn không thể tìm thấy gì trên Google? [đóng cửa]


18

Google tuyên bố là công bằng và lợi ích của công ty (hầu hết thời gian) là tìm kiếm trên Internet mọi thứ và mọi thứ mà các con nhện của nó có thể truy cập. Tôi muốn biết:

  • Google không cung cấp loại nội dung nào (có thể truy cập công khai)?
  • Có một loại nội dung cụ thể mà Google không thể truy xuất không?

Các tài liệu tham khảo, đặc biệt là tài liệu riêng của Google, sẽ đặc biệt tuyệt vời.


Giờ đây, EU đã ban hành "Quyền được lãng quên", có khá nhiều thứ chúng ta sẽ không thể tìm thấy nữa. Dưới đây là một số điều đã bị "lãng quên".
samthebrand

Câu trả lời:


21

Một vài ý tưởng về loại sự vật:

  1. Nội dung không được phép rõ ràng bởi robots.txttệp của một tên miền được loại trừ khỏi chỉ mục của Google.
  2. Các trang web không được liên kết từ các trang web khác mà Google đã biết. Đó là, có thể có rất nhiều trang web không được liên kết từ các trang hiển thị, những trang web đó sẽ không bao giờ được tìm thấy bởi nhện Google trừ khi chúng được gửi thủ công tới Google thông qua Công cụ quản trị trang web .
  3. Các trang web đằng sau các mẫu web mà bạn cần phải điền vào.
  4. Hình ảnh điều tra dân số. Vì nội dung là những hình ảnh thường được lập chỉ mục thủ công, chúng thường được tìm thấy trên các trang web trả tiền như aneopry.com.

Tìm hiểu thêm về Deep Web


2
Điểm 2 không đúng. Bạn có thể gửi một trang web tới Google thông qua Công cụ quản trị trang web và nó sẽ được lập chỉ mục ngay cả khi nó không được liên kết từ các trang web khác.
Alex

Điều đó đúng. Làm rõ tốt.
am

3
Thật ra tôi sẽ không đồng ý với điểm thứ hai. Tôi đã có một máy chủ web thử nghiệm trên PC của mình và nó đã được lập chỉ mục. Tôi tìm thấy điều này bằng cách kiểm tra nhật ký truy cập.
Bakudan

2
Tôi đã đăng ký tên miền mới, bắt đầu phát triển chúng và thấy Googlebot thu thập dữ liệu chúng chỉ vài ngày sau đó. Tôi nghĩ rằng điều này thật đáng sợ cho đến khi tôi nhận ra - tôi có thể không phải là người đầu tiên sở hữu tên miền này :) Họ không tiết lộ chi tiết cụ thể, nhưng tôi chắc chắn rằng họ theo dõi các tên miền mà mọi người nghĩ là đủ quan trọng để đăng ký và tại ít nhất một vài người truy cập tại một số điểm, ít nhất là trong một khoảng thời gian.
Tim Post

6

Ngoài Twitter, Google không lập chỉ mục Tumblr tốt như vậy. Các bài đăng trên blog trên Tumblr dễ dàng tìm thấy hơn bằng cách sử dụng tìm kiếm Tumblr. Ngoài ra, mọi thứ trên Google Site không (hoặc hầu như không) được lập chỉ mục. Nếu bạn bắt đầu một trang web Google, hãy lấy tên miền của riêng bạn.

Các blog nhỏ hơn không được cập nhật thường xuyên thường bị đổ từ kết quả tìm kiếm. Cộng với bất cứ điều gì mà họ nghĩ là một splog .


5

Chà, hầu hết nội dung Twitter không được Google lập chỉ mục, ngay cả khi nó công khai. Nó đã từng có sẵn cho Google, nhưng đó không còn là trường hợp nữa kể từ khi thỏa thuận của họ hết hạn.

Nguồn .


Mặc dù đúng, câu hỏi đặt ra "nội dung chất lượng cao" nào không có sẵn trong Google. Hầu hết Twitter sẽ không đáp ứng tiêu chí đó :) Tôi thực sự thấy tweet kỳ lạ xuất hiện trong tìm kiếm của Google.
HappyTimeGopher

4

Nó phụ thuộc vào quốc gia bạn. Ở Đức, nó không hiển thị hàng ngàn trang web mà chính phủ cho rằng không tốt cho bạn và danh sách này tăng lên hàng nghìn trang mỗi năm.

Google là động cơ của kiểm duyệt Internet. Nếu bạn muốn có Internet miễn phí, hãy sử dụng một số công ty không xấu, như DuckDuckGo hoặc các công ty khác.




1

Các trang web có quá nhiều nội dung mà google chỉ đơn giản là không có thời gian (hoặc thiên hướng) để lập chỉ mục tất cả.

Các trang web không có bản đồ trang web có thể thu thập thông tin và yêu cầu google cung cấp cụm từ tìm kiếm để truy cập các kết quả có sẵn trên trang web có thể không được lập chỉ mục đầy đủ.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.