An toàn web cho trang web của trẻ


12

Tôi đang xây dựng một trang Wordpress cho một phụ huynh của một đứa trẻ 11 tuổi muốn một cái gì đó để tưởng niệm các thành tích thể thao, học tập và cá nhân của con gái mình. Trang web bao gồm hình ảnh và video của cô ấy và bạn bè, thông tin tiểu sử và bài đăng trên blog. Tên miền được đăng ký riêng trong tên công ty của tôi, tôi không thêm chúng vào bảng điều khiển Google và tôi đang giảm thiểu SEO khác. Không có tên hoặc địa chỉ vật lý cuối cùng. Tôi muốn có sự an toàn trên web càng nhiều càng tốt để tránh những kẻ phá hoại lấy ảnh của cô ấy v.v., đôi mắt tò mò, v.v. đáng để điều tra và đáng để chấm điểm tôi. Trang web của trẻ em có hương vị tuyệt vời và phụ huynh rất thực tế,

Có phương pháp đáng tin cậy nào tôi có thể thực hiện để tăng tính an toàn Web cho trang web 11 tuổi này không?


3
Đây là một sự khởi đầu: webmasters.stackexchange.com/questions/77031/ nam Tôi sẽ suy nghĩ về các ý tưởng khác cho trang web nói chung. BTW- Tốt cho bạn khi nhận nhiệm vụ này! Đó là một chút khó khăn. Nhưng cũng đáng nỗ lực !! Tôi đã từng làm lưu trữ từ thiện miễn phí cùng với lưu trữ trả phí và những lý do cao quý luôn là sở thích của tôi cho đến nay. Đây là những cái tôi nhớ!
Closnoc

3
Bạn nhận ra rằng không có gì bạn làm sẽ khiến nó vô hình 100% ... tất cả những gì bạn cần là đăng một liên kết tới Facebook hoặc Tumblr, và trang web đó sẽ ở ngoài đó ... Điều tốt nhất cần làm là có cha mẹ giám sát / phê duyệt tất cả nội dung mà đứa trẻ đang đăng và giáo dục cả về những gì chúng cần cẩn thận
HorusKol

4
Một robots.txttập tin với nội dung phù hợp có thể giữ tất cả các bot hợp pháp. Phần khó là phần còn lại. Rất nhiều trong số chúng có thể được tránh xa nếu địa chỉ của trang web khó tìm thấy.
kasperd

5
Ngoài tất cả những gì đã được nói, hãy lưu ý rằng Wordpress giữ nguyên hình ảnh dữ liệu EXIF ​​...
user1103

3
Điều này có cần phải là một trang web? Nếu bạn không muốn nó lan rộng và rơi vào tay kẻ xấu, tại sao lại đưa nó lên internet? Bạn có thể không tạo ra một cái gì đó khác trong trí nhớ của cô ấy và đưa nó cho cha mẹ / gia đình / những người liên quan?
Tom.Bowen89

Câu trả lời:


20

Tôi có lẽ bị hoang tưởng

Có lẽ tôi đang bị hoang tưởng, nhưng điều này nghe có vẻ như là một blog / trang web hoàn toàn riêng tư. I E. mật khẩu được bảo vệ. Ai chính xác là đối tượng mục tiêu?

Ngoài khía cạnh bảo mật (ngăn chặn sự vô đạo đức trong việc tìm kiếm và sử dụng nội dung), loại nội dung này có vẻ như đã chín muồi để bắt nạt từ các "bạn bè" khác của trường. Nội dung ban đầu có thể ổn - đến 11 tuổi - có thể trở nên lúng túng trong một vài năm.

Tôi không thêm chúng vào bảng điều khiển Google

Điều này dường như sẽ lạc hậu? Cách bạn ẩn nội dung khỏi Google (tức là bot "tốt") là sử dụng robotsthẻ meta (hoặc X-Robots-Tagtiêu đề) và có thể robots.txt. Bỏ qua nó từ Google Search Console sẽ không giúp ích gì về mặt này.

Ít nhất nếu bạn thêm nó vào Google Search Console, bạn có thể theo dõi những thứ như backlink, kiểm tra robot.txt, v.v ... Nếu thực sự bạn công khai.


1
Đây thực sự là giải pháp lành mạnh duy nhất. +1
MonkeyZeus

4
Làm rõ ngắn gọn - không thêm trang web vào Google Search Console có nghĩa là không thông báo trực tiếp cho Google về một trang web. Điều này có nghĩa là bạn sẽ không theo cách của bạn để khiến Google chú ý đến bạn. Tuy nhiên, điều đó không có nghĩa là Google KHÔNG thể thông báo cho bạn - bạn sẽ sử dụng các tệp robot cho điều đó, như w3d đề xuất. Hơn nữa, làm cho trang web được bảo vệ bằng mật khẩu có nghĩa là hầu hết Google có thể lập chỉ mục sẽ là trang đăng nhập.
Jake

11
"Cách bạn ẩn nội dung khỏi Google"không đưa nó lên internet ngay từ đầu .
Cuộc đua nhẹ nhàng với Monica

2
Tôi nghĩ rằng mật khẩu bảo vệ thư mục sẽ đánh bại các lý do người mẹ muốn có một trang web, trong trường hợp đó chúng tôi có thể vừa tạo một lá thư tin tức từ doc và gửi qua email. Con gái muốn bắt đầu một blog. Các bà mẹ không ngu ngốc cô sàng lọc và chỉnh sửa nội dung. Tôi không tin rằng họ đang làm bất cứ điều gì vô trách nhiệm ở đây. Đây là phản hồi tuyệt vời về câu hỏi này.
rhill45

Mật khẩu bảo vệ trang web trong WP không liên quan gì đến việc bảo mật phương tiện truyền thông.
trống

6

Câu trả lời thích hợp duy nhất là mật khẩu bảo vệ toàn bộ. HTTP BASIC_AUTH có lẽ là đơn giản nhất để thiết lập, vì nó sẽ không tương tác với WordPress theo bất kỳ cách nào. Điều đó tự nó sẽ đủ để ngăn chặn tất cả những người dọn dẹp, nhưng nếu bạn muốn bảo mật đúng cách, bạn cũng nên sử dụng HTTPS.

(Sidenote: Với nhiều hệ thống, trang HTTP sẽ chuyển hướng đến HTTPS. Tuy nhiên, với HTTP BASIC_AUTH, chuyển hướng đó có thể sau dấu nhắc cho mật khẩu của bạn. Trang HTTPS sẽ nhắc lại mật khẩu. Điều này có nghĩa là mật khẩu của bạn đã được nhập lại. hai lần, một lần trong văn bản rõ ràng và một lần qua kênh bảo mật. Về nguyên tắc, có thể có các mật khẩu khác nhau cho các phiên bản HTTP và HTTPS hoặc không có mật khẩu cho phiên bản HTTP: tất cả chỉ là chuyển hướng sang phiên bản HTTPS, sau đó hỏi mật khẩu của bạn. Việc cài đặt này dễ dàng như thế nào tùy thuộc vào công cụ bạn đang sử dụng để quản lý tùy chọn lưu trữ trang web của bạn. Ngoài ra, chỉ cần đảm bảo rằng bạn luôn điều hướng trực tiếpđến trang HTTPS, bỏ qua phiên bản không an toàn. Nếu bạn sử dụng hệ thống mật khẩu khác với HTTP BASIC_AUTH, thì có lẽ không có ứng dụng phụ này sẽ được áp dụng.)


4
Nếu bạn muốn đi theo con đường được bảo vệ bằng mật khẩu, thì đây là một trang web WordPress, chỉ cần sử dụng WordPress để xử lý tất cả là phương pháp dễ dàng hơn nhiều: codex.wordpress.org/Content_Visibility#Private_Content
Doyle Lewis

1
@DoyleLewis. Điều đó sẽ bảo vệ tài sản tĩnh, chẳng hạn như hình ảnh được tải lên? Phải thừa nhận rằng, một trình thu thập thông tin không có khả năng tìm thấy chúng (miễn là bạn có Options -Indexes).
TRiG

Tôi đã xem xét https nhưng vấn đề chỉ là chi phí. Tôi ước tôi có thể tìm cách điều hành trang web của cô ấy dưới các công ty của tôi ssl nhưng tất nhiên là không thể
rhill45

2
letencrypt.org @ rhill45.
TRiG

1
@TRiG Nếu ai đó có URL tới tệp phương tiện tĩnh, thì không, nó sẽ không bảo vệ điều đó. Nhưng không có trình thu thập thông tin nào có thể truy cập được vì họ sẽ không thể truy cập nội dung sẽ liên kết đến tệp.
Doyle Lewis

3

Đầu tiên, tôi sẽ gửi lời xin lỗi đến tất cả các quản trị web chuyên nghiệp ngoài kia, nhưng đối với OP này, tôi có một gợi ý vàng:

Vi phạm nguyên tắc công cụ tìm kiếm

Và tôi có nghĩa là làm điều đó đến mức mà nội dung quan trọng nằm trong javascript phức tạp và các robot nội dung có thể thu thập dữ liệu không có trong HTML phù hợp. Điều này bao gồm thẻ mô tả xấu, thẻ tiêu đề xấu, v.v ... Heck, có thể biến toàn bộ nội dung thành một video được tạo trong flash hoặc hiển thị toàn bộ nội dung dưới dạng một hình ảnh. Điều đó thực sự sẽ làm cho công cụ tìm kiếm thu thập thông tin co rúm.

Tôi sẽ hiển thị bằng ví dụ trong mã:

Đây là một cách để có được một cái gì đó được lập chỉ mục:

<!DOCTYPE html>
<html>
<head>
<title>Web page</title>
<meta name="description" content="This is a wonderful web page">
</head>
<body>
<h1>A wonderful web page</h1>
<h2>By John Smith</h2>
<p>This is a wonderful page. ya de ya de ya de ya de ya de ya de</p>
<p>This is wonderful. ya de ya de ya de ya de ya de ya de</p>
</body>
</html>

Ok, tôi thừa nhận, văn bản không hoàn hảo, nhưng bạn hiểu ý tôi là gì.

Bây giờ nếu bạn muốn ẩn nó khỏi trình thu thập thông tin và thực hiện theo cách đơn giản, bạn có thể thử điều này:

<!DOCTYPE html>
<html>
<head>
<title>Private</title>
</head>
<body>
<img src="mywebsite.jpg" width=1024 height=768>
</body>
</html>

sau đó tạo một hình ảnh có tên mywebsite.jpg và bao gồm tất cả các văn bản trong đó, không phải trong html được hiển thị ở trên. Sau đó, bạn cần bảo vệ mywebsite.jpg bằng cách tạo phiên bản thủy ấn của nó cho người dùng không được phép nhìn thấy vật thật. Chỉ cần so sánh các chuỗi tác nhân người dùng hoặc địa chỉ IP với những người bạn cho phép / không cho phép hình ảnh. Loại điều này có thể được thực hiện trong .htaccess với một số quy tắc viết lại.

Ví dụ: để buộc googlebot xem hình ảnh thủy ấn thay vì ảnh thật, hãy sử dụng các quy tắc sau:

RewriteCond %{HTTP_USER_AGENT} ^googlebot$ [NC]
RewriteRule ^mywebsite.jpg$ specialrobotimage.jpg [L]

Tôi giả sử ở đây rằng mywebsite.jpg là trang web thực sự của bạn dưới dạng hình ảnh và Specialrobotimage.jpg là hình mờ hoặc hình ảnh dưới dạng tin nhắn chỉ cho biết người dùng thực sự mới được phép xem thông tin. Ngoài ra, các quy tắc giả định mọi thứ đều nằm trong cùng một thư mục.


Thật vậy, điều JS có thể là cách để đi rất nhiều. Trong khi một số bot chạy JS, người dọn dẹp và những thứ không thường không làm được. Điều này có nghĩa là các đối tượng DOM HTML khác nhau có thể được đặt thành nội dung thực khi JS chạy. Tôi không đề xuất dựa vào các tác nhân người dùng vì điều này thường được giả mạo bởi người dọn dẹp. Cân nhắc cài đặt ModSecurity và để điều đó thực hiện hầu hết công việc cho bạn.
Closnoc

11
Đây thực sự là lời khuyên tồi. Đó là rất nhiều công việc không có lợi ích thực sự. Một tấn bot chạy JavaScript những ngày này. Nội dung trong video hoặc hình ảnh không dễ duy trì (cộng với cả hai vẫn được lập chỉ mục thường xuyên). Ngay cả nội dung trong Flash đã được lập chỉ mục trong nhiều năm.
Brad

Ok tôi đã quên đề cập rằng không nên lập chỉ mục cho hình ảnh và video. Tôi hiểu rằng chúng không dễ bảo trì, nhưng ít nhất văn bản không thể dễ dàng sửa đổi. Mặt khác, chỉ cần văn bản thô ở trên một trang, thì trình thu thập thông tin có thể lấy đoạn văn bản, sửa đổi nó, thêm một mẫu cho nó và sau đó xây dựng một trang web khác từ đó. Tôi nghi ngờ trình thu thập thông tin có khả năng trích xuất văn bản từ hình ảnh hoặc video.
Mike

3

Đầu tiên đây thực sự là một câu hỏi WP. Tôi đã viết hơn 20 trang web làm những gì bạn cần vì vậy việc này khá dễ dàng.

1 Bạn làm cho tất cả mọi người đăng nhập để xem mọi trang.

2 Bạn khóa thư mục tải lên qua tập lệnh và .htaccess. Có các kịch bản sẽ kiểm tra đăng nhập của người dùng trước khi cho phép họ xem phương tiện truyền thông.

Nếu bạn muốn làm bất cứ điều gì ở giữa điều này và mở rộng trang web của bạn - đó là rất nhiều công việc. Cách dễ nhất để làm điều đó là có hai thư mục tải lên - một có bảo mật và một cho mọi thứ khác nếu bạn muốn mở một số trang cho công chúng và một số thì không.

Đối với những gì người khác đang nói về nội dung - không thể tìm thấy nó nếu các trang của bạn bị khóa ... điều đó không thực sự đúng. Tôi có các kịch bản robot sẽ tìm kiếm tào lao ra khỏi một thư mục cho tên tệp.

Tất cả các cuộc nói chuyện của google và robot là vô nghĩa. Những thứ đó chỉ quan trọng nếu bạn muốn nửa vời nó. Nếu bạn làm như vậy thì hãy tư vấn từ một số câu hỏi nâng cao ở trên.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.