Các trang lập chỉ mục của Google với #! mặc dù chúng tôi không có bất kỳ


11

Công ty chúng tôi đã phát triển Ứng dụng một trang bằng AngularJS và định tuyến của nó. Google đã lập chỉ mục trang web của chúng tôi bằng JavaScript nhưng nó không lập chỉ mục một số trang rất tốt vì vậy chúng tôi đã phát triển một phiên bản chỉ HTML.

Chúng tôi đã theo Thông số kỹ thuật thu thập thông tin Ajax được đăng ở đây và có một <meta name='fragment' content='!'>thẻ và các url chính tắc. Chúng tôi hy vọng http://www.example.com/foo/barsẽ được lấy từ http://www.example.com/?_escaped_fragment_=/foo/bar.

Tuy nhiên, chúng tôi đã phát hiện ra rằng khi chúng tôi triển khai đặc tả AJAX, giờ đây chúng tôi có tất cả các trang được lập chỉ mục hai lần, một lần với phiên bản JavaScript như http://www.example.com/foo/barvà một lần với phiên bản mới như http://www.example.com/#!/foo/bar. Điều này có hại cho chúng tôi vì nó trùng lặp nội dung và cũng là trang web đại diện sai.

Tôi đã cố gắng tìm kiếm các câu hỏi tương tự ở đây và trong diễn đàn sản phẩm của Google nhưng không thể đưa ra bất cứ điều gì.


Bạn đã nêu vấn đề này với Google chưa? Trên diễn đàn của họ?
Jérôme Verstrynge

@JVerstry có - Tôi đã thực hiện điều đó ngay sau khi tôi đăng câu hỏi này: Productforums.google.com/forum/, Tuy nhiên, giả định đầu tiên của tôi là chúng tôi không hiểu chính xác giao thức thay vì có gì đó không ổn với sản phẩm của họ nên cơ hội nhận được Trợ giúp ở đây khá tốt ngoài câu hỏi này có liên quan đến đối tượng mục tiêu lớn ở đây (Mọi người có một ứng dụng trang không sử dụng #! trong URLS và muốn Google lập chỉ mục cho họ). Cảm ơn lời đề nghị bằng cách này.
Benjamin Gruenbaum

1
Bạn đã xác định URL chính tắc thông qua rel="canonical"?
kqw

3
chuyển hướng #! các url và che giấu các url xấu xí có vẻ như bạn không tuân theo các đặc điểm kỹ thuật.
Tony McCreath

1
Chỉ cần tự hỏi, nếu bạn không sử dụng #!URL, tại sao bạn lại sử dụng _escaped_fragment_và thông số Google AJAX?
MrWhite

Câu trả lời:


2

Khi nghi ngờ, sử dụng rel="canonical". Điều này có thể đơn giản như đưa <link rel="canonical" href="http://blog.example.com/dresses/green-dresses-are-awesome" />vào của bạn <head>. Xem Google để biết thêm.

Điều này sẽ không ngăn các bot thu thập dữ liệu cả hai "phiên bản", nhưng nó sẽ báo cho Google (và các SERP khác) chỉ lập chỉ mục cho tài liệu chính tắc.


Trong cùng một hướng, anh ta có thể sử dụng tệp robot.txt không ??
Eyoung100

Chúng tôi có những thứ đó, họ đã không giúp đỡ trong trường hợp này.
Benjamin Gruenbaum

1

Tôi không thực sự hiểu về javascript.
Trong Google lập chỉ mục , chúng tôi sử dụng url chuẩn trong <head>như @philtune nói. Nhưng nếu bạn không thể mong đợi http://www.example.com/foo/barđược lấy từ http://www.example.com/?_escaped_fragment_=/foo/bar.

Google Fetch vừa tìm nạp canonical url.

Trong trường hợp này, url là http://www.example.com/foo/bar, google cũng sẽ lập chỉ mục http://www.example.com/foo/bar.

Nếu bạn muốn Google lập chỉ mục trang của bạn, hãy thêm tập lệnh này vào <head>:

<meta content = 'index, theo dõi' name = 'googlebot' />

và sau đó tìm nạp lại bằng cách sử dụng Google Fetch.

Note:
google sẽ crwal và theo dõi và thu thập dữ liệu trang web và theo dõi tất cả các liên kết trên trang. Nếu trong trang của bạn có một liên kết thích http://www.example.com/?_escaped_fragment_=/foo/barvà chuyển hướng đến http://www.example.com/foo/bar, google sẽ lập chỉ mục http://www.example.com/foo/barhttp://www.example.com/?_escaped_fragment_=/foo/barđược chuyển hướng đến http://www.example.com/foo/bar.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.