Có thể chấp nhận tải lên nội dung gây khó chịu lên GitHub không? [đóng cửa]


12

Tôi đã phát triển một trình kiểm tra nội dung gây khó chịu cho trang web của mình và muốn xuất bản nó trên GitHub . Tuy nhiên, mã nguồn chứa nhiều nội dung gây khó chịu, phân biệt chủng tộc và mặt khác.

Nguồn này được ghi lại đầy đủ, nhưng tôi muốn ý kiến ​​của bạn về việc có thể chấp nhận xuất bản tác phẩm như vậy trên GitHub hay không để lại chuỗi các chuỗi theo trí tưởng tượng của người đọc?!


11
Câu hỏi quan trọng có khả năng là "nó thực sự gây khó chịu? Hay nó chỉ là một 'dictonary'?" mà được đưa vào Github TOS - §7 gợi ý rằng họ có thể (nhưng không có nghĩa vụ phải) xóa nó. Bạn có thể muốn có các chuỗi được trích xuất sang một tệp khác, sau đó được mã hóa rot13 hoặc một cái gì đó có tính chất đó để tránh xúc phạm trình duyệt nhân quả.

1
Tôi đoán là ổn, chỉ cần cảnh báo những độc giả có thể có trong Readme, có rất nhiều từ ngữ xúc phạm trong những người khác GitHub Repos. Thêm vào đó, trường hợp của bạn là đức tin tốt.
jacktrades

5
Tại sao không đặt tất cả các từ vào một tệp văn bản hoặc cơ sở dữ liệu và tải chúng khi chạy. Sau đó đặt một từ chối trách nhiệm nhỏ vào đầu tập tin rằng văn bản dưới đây không dành cho người yếu tim. Mã của bạn sạch sẽ và bạn có thể sử dụng các tệp văn bản khác nhau cho các tình huống khác nhau?
Ampt

@Sparticus cảm ơn bình luận của bạn. Tôi đồng ý và nghĩ rằng đó có lẽ là cách tiếp cận tốt nhất cho tôi.
SimonGoldstone.com

5
Một từ tự nó không gây khó chịu. Ý định đằng sau nó làm cho nó gây khó chịu.
kaptan

Câu trả lời:


45

Tôi phải không đồng ý với giải pháp ROT-13. Làm xáo trộn những từ bị cấm của bạn chỉ đơn giản vì việc nhìn thấy chúng có thể xúc phạm ai đó là một sự lãng phí thời gian.

Từ điển của bạn về các từ xấu / quy tắc từ xấu phải xuất phát từ một tệp riêng biệt (có thể được tải trong thời gian chạy hoặc được nhúng dưới dạng tài nguyên) . Việc che giấu tập tin này chỉ đơn giản là làm cho bạn / các nhà phát triển khác / người dùng của bạn gặp khó khăn hơn trong việc thay đổi nó hoặc khắc phục bất kỳ vấn đề nào. Ngoài ra, nếu tôi thấy một tệp có tên "cấm_words.txt" trên ổ cứng của mình, tôi sẽ mong đợi nó chứa một danh sách các từ gây khó chịu.


Tôi đồng ý. Tôi không muốn làm xáo trộn các từ.
SimonGoldstone.com

5
+1 @simon Danh sách như vậy đã xuất hiện: github.com/snipe/banbuilder
dcaswell

2
@simon Tôi không có nghĩa là dự án của bạn không đáng giá, chỉ là github cho phép mọi người lưu trữ danh sách như bạn muốn. Câu trả lời khác không có có hay không, tôi chỉ muốn xác nhận với bạn rằng câu trả lời thực sự là Có.
dcaswell

1
"Phát minh lại bánh xe" là một phần của việc học ... đó là hầu hết những gì được dạy ở trường Cao đẳng.
WernerCD

2
Đôi khi bạn gặp phải những người có ... chúng ta sẽ nói như thế nào ... sự nhạy cảm nhạy cảm, những người có thể có một số ảnh hưởng cho dù việc phân phối chương trình ở lại hay đi. Nếu rot13ing tệp có nghĩa là nó ở lại, điều đó giúp OP đạt được mục tiêu của mình là bật mã và ở lại trên GitHub. Đó không phải là một sự lãng phí thời gian trong cuốn sách của tôi.
Blrfl

16

"Tất cả các vấn đề trong khoa học máy tính có thể được giải quyết bằng một mức độ gián tiếp khác." ( của David Wheeler ).

Tùy chọn của bạn không bị giới hạn trong việc tải lên hay không, nếu bạn tính đến việc bạn có thể mã hóa nội dung để nó không làm phiền độc giả.

  • Như một ví dụ, chỉ cần chuyển sang các chữ cái tiếp theo (A đến B, B đến C, vv với Z chuyển sang A đến mã hóa đầy đủ) có thể biến bốn chữ cái nổi tiếng từ vào hoàn toàn vô hại Gvdl . Tất cả những gì bạn cần để sử dụng nó trong ứng dụng của bạn sẽ là chuyển nó trở lại theo hướng ngược lại, với các chữ cái trước đó , với A chuyển sang Z.

Như đã chỉ ra trong các bình luận , một cách tiếp cận như trên được sử dụng trong mật mã thay thế chữ ROT13 , được biết đến với công dụng "như một phương tiện để che giấu ... các tài liệu gây khó chịu từ cái nhìn thoáng qua ..."

 

http://upload.wik hè.org/wikipedia/commons/thumb/3/33/ROT13_table_with_example.svg/320px-ROT13_table_with_example.svg.png


Để hoàn thiện, hãy xem xét thêm việc chạy trình kiểm tra của bạn dựa vào từ điển được mã hóa , để đảm bảo rằng mã hóa được chọn không vô tình biến một từ gây khó chịu thành một từ khác.

Khi mã hóa những thứ như vậy, sẽ rất hợp lý khi kiểm tra lại, bởi vì người ta không thể dự đoán được mọi thứ một cách đáng tin cậy. Trong một trong những dự án trước đây của tôi, chúng tôi đã bị mất thư khá nghiêm trọng khi một người kiểm tra bị định cấu hình sai bắt đầu phát hiện ra nội dung gây khó chịu trong các chuỗi ký tự ngẫu nhiên (trong nội dung uuencoding của kho lưu trữ ZIP).


So với việc chuyển xung quanh văn bản thuần túy, Gvdl , mã hóa có một lợi ích đáng kể là tránh hoàn toàn các vấn đề pháp lý và tất cả các rủi ro và phụ thuộc liên quan .

Chỉ cần nghĩ về nó. Nói, điều khoản dịch vụ cụ thể tại một kho lưu trữ cụ thể cho phép nội dung của tôi, tốt.

Nhưng, nếu họ quyết định thay đổi ĐKDV thì sao? Hoặc, nếu tôi quyết định thay đổi sang kho lưu trữ khác, có các điều khoản không tương thích. Tôi sẽ làm gì đây?

Lưu ý bằng cách ngay cả khi ở kho lưu trữ "thân thiện", ở đây và bây giờ, vẫn không hoàn toàn an toàn.

Điều gì xảy ra nếu ai đó sẽ không thể tải xuống nội dung của tôi vì bộ lọc web kỳ lạ ? Tôi có sẵn sàng trả lời các khiếu nại của người dùng và giải thích cách khắc phục bộ lọc không? Bộ lọc của họ ...

... Bạn thấy đấy, tôi thà suy nghĩ kỹ trước khi quyết định chống lại tiền mã hóa. Và ngay cả khi tôi quyết định, tôi sẽ đảm bảo rằng tôi có một lý do rất, rất tốt cho việc đó.


6
Rot13 là loại tiêu chuẩn thực tế cho điều đó. Rot13 đôi thậm chí còn tốt hơn. :-)
Blrfl

5
@Blrfl giống như triple DES tốt hơn DES, triple rot13 là con đường để đi.

1
Tôi nghĩ rằng có các plugin cho nhiều trình soạn thảo giúp chỉnh sửa các tệp rot13 không khó hơn chỉnh sửa bất kỳ tệp nào khác ở định dạng chuyên biệt
JoelFan

2
@Simon của nó không quá nhiều đến nỗi rot13 là tối nghĩa - mà chỉ là một cách tiêu chuẩn để che giấu văn bản một cách tầm thường. Nhận ra rằng một số tường lửa có thể được cấu hình để chặn các mẫu ký tự nhất định gây khó khăn cho văn bản của bạn về chức năng của chương trình. Không phải sự xúc phạm đó là vấn đề có thể xảy ra, nhưng các rào cản công nghệ khác có thể không nhận ra sự khác biệt giữa "thứ gì đó bạn muốn tải xuống" và "thứ gì đó bạn muốn chặn". Có, họ có thể lấy mã zip, nhưng họ sẽ không thể sao chép hoặc ngã ba hoặc đẩy.

2
@ThomasEding Caesar dịch mật mã bằng một chữ cái. Ký tự đầu tiên ban đầu là 'F'.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.