Bộ lọc thô tục cho một cuộc trò chuyện MMO


32

Chúng tôi đang phát triển MMO bằng Smartfox Server. Đối tượng mục tiêu là trẻ em từ 7 -12 tuổi.

Có một tùy chọn trò chuyện toàn cầu trong MMO này.
Bất cứ thứ gì người dùng gõ vào hộp văn bản đều được hiển thị bên cạnh hình đại diện của người dùng sau khi anh ấy / cô ấy nhấn enter.

Chúng tôi muốn lọc ngôn ngữ lạm dụng / thô tục từ cuộc trò chuyện này.
Chúng tôi có thể chụp trò chuyện và đọc văn bản. Vấn đề là nhận được danh sách thô tục.

Câu hỏi của chúng tôi là

  1. Nơi nào sẽ có được danh sách đầy đủ của tất cả các từ thô tục?
  2. Phương pháp nào được thông qua trong kịch bản tương tự để lọc ra những phương pháp này?

17
Chúc may mắn với vấn đề Scunthorpe .
Cyclops

7
@yetanothercoder, quan điểm của tôi là, lọc là một vấn đề khó . Chẳng hạn, trò chơi của bạn sẽ có sự kiện nào vào thứ bảy không? Người chơi có thể nhập từ "Thứ bảy" (lưu ý bốn chữ cái ở giữa) vào hộp trò chuyện của họ không? (Và không biết tại sao downvote - đó không phải là một câu hỏi tồi , nhưng có thể không có câu trả lời đơn giản).
Cyclops

6
Và nó thậm chí còn phức tạp hơn khi có nhiều ngôn ngữ ra đời. Ví dụ: Starcraft 2 xóa "weniger" khỏi trò chuyện, đó chỉ là từ tiếng Đức có nghĩa là "ít" ...
bummzack

4
Một vấn đề khác tôi gặp phải thường xuyên khi còn trẻ và chơi MMO được lọc là chúng dựa trên ngôn ngữ tiếng Anh. Vì vậy, nếu tôi nói tiếng Pháp, một số từ tiếng Pháp đàng hoàng sẽ bị kiểm duyệt vì chúng trông giống như những lời nguyền tiếng Anh, và trong mọi trường hợp, tôi vẫn có thể nguyền rủa bằng tiếng Pháp tất cả những gì tôi muốn.
Xeon06

2
Từ những gì tôi đã thấy, điều quan trọng nhất để tạo ra một bộ lọc tốt là có một tùy chọn để tắt nó. Nếu bạn không có lựa chọn nào và người chơi biết rằng họ không có lựa chọn nào khác ngoài việc bị kiểm duyệt, họ SILL phá vỡ sự kiểm duyệt. Nếu bạn làm cho họ dễ dàng tắt nó đi, rất có thể họ sẽ ngừng phá vỡ nó và những người không muốn trải nghiệm ngôn ngữ khắc nghiệt sẽ không phải đối phó với những người đang cố gắng phá vỡ bộ lọc.
Michael Zehnich

Câu trả lời:


46

Đừng.

Bộ lọc không hoạt động. Ít nhất, chỉ các bộ lọc không hoạt động. Danh sách trắng, danh sách đen, nó không thành vấn đề. Cả hai điều này sẽ không bao giờ ngăn cản trẻ em quấy rối lẫn nhau. Cách duy nhất để thực hiện công việc này là không lọc trò chuyện mà phải cung cấp các khối xây dựng lớn cho câu. Ví dụ: một đứa trẻ có thể chọn "Bạn có muốn ..." và các tùy chọn cho "đi đến ..." và "giao dịch ..." sẽ được kéo lên. Chọn "đi đến ..." sẽ hiển thị danh sách các địa điểm trong trò chơi.

Disney đã giải quyết phương pháp này cho MMO "Toontown" của họ, sau khi đối tượng thử nghiệm danh sách trắng 14 tuổi của họ quyết định "dán con hươu cao cổ dài [của mình] lên chú thỏ trắng mịn" của họ. Nói một cách đơn giản, bạn không thể đưa vào danh sách đen hoặc danh sách trắng đủ từ để tránh lạm dụng.


Điều đó đã được nói, nếu tôi đang thiết kế MMO cho trẻ em, tôi thực sự sẽ thực hiện một bộ lọc danh sách đen nghiêm ngặt, nhưng chỉ như một tuyến phòng thủ thứ hai. Tuyến phòng thủ đầu tiên của bạn phải luôn là người điều hành và khả năng báo cáo lạm dụng. Tôi sẽ cân nhắc các từ trong danh sách đen, với mỗi người dùng nhận được một số điểm bí mật về mức độ họ đang cố gắng trở nên thô tục.

Rất có thể, bất kỳ người dùng nào sẽ thử và phá vỡ bộ lọc của bạn sẽ kích hoạt nó trước. Những lời tục tĩu rõ ràng hơn, (trái ngược với những điều tối nghĩa hoặc lỗi thời), hoặc những nỗ lực thô tục lặp đi lặp lại nhiều hơn, đưa chúng vào danh sách theo dõi cho người điều hành hoặc một số danh sách cấm . Bằng cách này, người điều hành có thể tập trung vào những người dùng dường như đang cố gắng quấy rối người khác thay vì lãng phí thời gian để đọc những bình luận của những đứa trẻ vẫn còn ngây thơ.


6
+1 chỉ dành cho liên kết Toontown - Tôi đặc biệt thích việc người dùng sử dụng các kênh bí mật để mọi người trao đổi mã bí mật của họ, để họ có thể bỏ qua bộ lọc.
Cyclops

1
Đó là một bài đọc thực sự thú vị mà tôi nghĩ tôi sẽ tìm hiểu và chia sẻ. Nếu bạn không đọc phần còn lại của câu trả lời của tôi, ít nhất hãy đọc nó. = P
dlras2

2
Tôi tin rằng Blizzard sử dụng kỹ thuật này (số điểm bí mật về số lần nguyền rủa được đăng lên trò chuyện chung) trong World of Warcraft, ít nhất là tôi biết họ đã từng sử dụng.
Nate

2
@Dan Kinh nghiệm cá nhân thôi. Tôi đã bị cấm tự động. (Đó là trải nghiệm khác với việc bị GM cấm) Một số douche đã chửi mắng một số con gà con trong bang hội của tôi, và tôi đã đuổi theo anh ta. Tôi không bị cấm trong trò chơi, chỉ từ / Chung trong một khoảng thời gian.
Nate

2
+1 cho từ đầu tiên "Đừng." Chu vi là những gì xảy ra và là lý do tại sao bạn sẽ cảm thấy như mình đã lãng phí tài nguyên lập trình có giá trị để tạo ra một đống meecrob lớn ! ;-D
Randolf Richardson

10

Đáp lại những người nói không cung cấp bộ lọc, tôi cho rằng bạn phải cung cấp bộ lọc, không vì lý do nào khác ngoài việc che mông của bạn đối với cha mẹ của đối tượng dự định của bạn. Chỉ cần chắc chắn rằng nó có thể bị vô hiệu hóa bởi người dùng. Bằng cách triển khai bộ lọc thô tục (mặc dù không hoàn hảo và hoàn toàn không bắt buộc), bạn có thể nói rằng bạn đã làm mọi thứ bạn mong đợi để bảo vệ sự nhạy cảm của khán giả trẻ.

Bằng cách làm cho nó có thể vô hiệu hóa, bạn không khuyến khích người dùng cố gắng phá vỡ nó bằng cách sử dụng dấu câu hoặc thay thế thông minh, vì những người ủng hộ loại ngôn ngữ đó sẽ ngay lập tức vô hiệu hóa bộ lọc trên máy tính của họ và từ lâu họ sẽ quên rằng bộ lọc thậm chí còn tồn tại .

Với sự hiểu biết đó, đừng lo lắng quá nhiều về việc thực hiện. Nó không cần phải được đánh lừa (điều này là tốt, bởi vì nó không thể là hoàn hảo), nhưng nó phải tương đối đầy đủ và không xâm phạm nhất có thể. Đó là, bạn sẽ không chắc chắn rằng mình không phạm phải "sai lầm clbuttic ".

Việc thực hiện có thể cực kỳ đơn giản - lấy một danh sách từ và thay thế bất kỳ từ nào được tìm thấy trong danh sách bằng dấu hoa thị hoặc một cái gì đó tương tự. Tốt nhất để tìm kiếm toàn bộ từ chỉ, là tốt.

Đối với một danh sách từ, điều đó thật dễ dàng: http://www.google.com/search?q=profanity+word+list

Hãy nhớ rằng, nó không nhất thiết phải bao gồm tất cả, nó chỉ phải là đại diện cho một nỗ lực dũng cảm từ phía bạn để bảo vệ trẻ em.


1
+1 cũng sẽ là cách tiếp cận của tôi, sau khi nghiên cứu chi tiết những gì bạn thực sự cần làm cho một xếp hạng độ tuổi cụ thể.
Oskar Duveborn

5

Tôi sẽ cố gắng thực hiện một giải pháp cho phép đưa vào danh sách đen và danh sách trắng, nơi bạn có thể thêm 'lồn' vào danh sách đen và 'scunthorpe' vào danh sách trắng chẳng hạn.

Tôi không tin rằng bạn có thể đã từng thực hiện một giải pháp chạy failsafe, vì vậy tôi muốn thử để nhận được nhiều nhất từ "nổi tiếng" trong từ điển của bạn, và làm cho nó dễ dàng như có thể thêm từ mới vào danh sách.

Lý do cho điều này là các ngôn ngữ, đặc biệt là tiếng Anh, liên tục phát triển và thứ gì đó không gây khó chịu trong nhiều thập kỷ có thể trở nên gây khó chịu trong bối cảnh phù hợp.

Hãy cố gắng để có được nhiều từ nhất có thể và đi từ đó, có thời gian phản ứng nhanh khi mọi người phàn nàn và cho thấy rằng đây thường là một mối quan tâm và tôi nghi ngờ bạn sẽ có bất kỳ vấn đề nào.

Sẽ là một ý tưởng tốt để biết chính xác các hướng dẫn kiểm duyệt tại Hoa Kỳ: MBNL! (tôi không phải là luật sư!)


3
Giải pháp cho sự phát triển ngôn ngữ là lọc theo preanity .
Cyclops

@Cyclops Thắng! xD
Jonathan Connell

4

Như tôi đã nhận xét, lọc tất cả các từ gây khó chịu thực sự khó khăn - nhưng bạn có thể xoay nó và sử dụng danh sách trắng các từ được phép . Khi tìm kiếm trên google, có vẻ như khá phổ biến đối với trò chơi của trẻ em để giới hạn những gì chúng có thể nhập vào danh sách. Chẳng hạn, Lego Universe sử dụng danh sách trắng.

Cũng xem: Danh sách trắng để trò chuyện . Và lưu ý rằng danh sách trắng có thể bị phá vỡ . Không có giải pháp đảm bảo.

Xem xét rằng nó dành cho trẻ nhỏ và việc đánh vần sai có thể là một vấn đề - tùy thuộc vào giao diện máy khách, bạn có thể xem xét tự động hoàn thành từ . Khi người chơi bắt đầu nhập các chữ cái, hãy đưa ra một danh sách các từ có thể và để họ chọn từ đúng.


Ý tưởng hay, mặc dù nó có vẻ lạ đối với tôi trong một trò chơi dành cho trẻ nhỏ có thể bị sai chính tả. Nó cũng có thể cản trở sự phát triển cá nhân của họ ra khỏi phạm vi của những gì có sẵn trong danh sách trắng.
Jonathan Connell

@ 3nixios, tôi đồng ý rằng nó có vấn đề, nhưng vì vậy mọi giải pháp có thể. :) Một cách khắc phục vấn đề chính tả sẽ là - chờ đã, tôi nên thêm nó vào bài viết của mình. :)
Cyclops

+1: điều này sẽ an toàn hơn rất nhiều nhưng như @ 3nixios: nói rằng nó sẽ cản trở sự phát triển hoặc nó sẽ là một danh sách rất lớn và vì vậy thời gian thực hiện được tăng lên phải không?
naveen

@yetanothercoder, tùy thuộc vào loại máy khách (tôi giả sử html / javascript), bạn có thể tải xuống trước danh sách các từ hợp lệ và kiểm tra chúng trong máy khách. Điều này sẽ không làm chậm máy chủ (mặc dù về mặt lý thuyết có thể bị bỏ qua bởi một lập trình viên thông minh). Vâng, đây là công việc nhiều hơn - một lần nữa, không có giải pháp dễ dàng, xin lỗi. Tất cả phụ thuộc vào mức độ rủi ro được chấp nhận.
Cyclops

1
@Cyclops Đối với một trò chơi trẻ em, đây có thể là một giải pháp chấp nhận được nếu bạn chỉ xem xét trẻ em chơi. Thật không may, kiểm tra phía khách hàng có nghĩa là một 'người đàn ông xấu' có thể dễ dàng nói những gì anh ta thích với những người chơi khác.
Jonathan Connell

4

Có một câu trả lời từ các lập trình viên mô tả một hệ thống để xây dựng bộ lọc thô tục. Anh ta không giải thích cách anh ta thực sự xây dựng nó rất chi tiết, nhưng nó đủ để có một ý tưởng để thực hiện.


4

Đây là một vấn đề được giải quyết tốt nhất bởi con người và thiết kế xã hội hơn là mã.

Nguồn tốt nhất của bạn cho một danh sách đầy đủ là một người sống có mặt trong trò chơi và theo dõi luồng trò chuyện. Đặt mọi người vào trò chơi của bạn và để họ là bộ lọc cuối cùng của bạn.

Dành thời gian xem xét các ý tưởng và triết lý của Lane Merrifield đằng sau Club Penguin và về việc cung cấp dịch vụ. Đây là hai bài viết từ bài thuyết trình của anh ấy tại Austin GDC năm 2008. Tôi đã thấy nó và nhớ rằng tôi rất ấn tượng với phong cách giải quyết vấn đề của con người với con người chứ không phải mã.

http://gamasutra.com/php-bin/news_index.php?story=20234

http://www.raphkoster.com/2008/09/15/agdc08-lane-merrifield-at-their-service/

Cụ thể vì trò chơi của bạn nhắm vào trẻ em, nó không chỉ là những bộ lọc mà bạn cần phải suy nghĩ. Bạn sẽ cần lo lắng về những người đóng giả là những đứa trẻ có thể có hoặc không có động cơ xấu. Bạn sẽ cần phải đảm bảo với cha mẹ rằng con cái họ được an toàn. Bạn sẽ cần phải đảm bảo với trẻ rằng chúng cũng an toàn cho vấn đề đó.

Một điểm cộng nữa cho con người là họ sẽ hiểu bối cảnh. Bạn không muốn một đứa trẻ nói rằng "Mẹ tôi bị ung thư vú" và bị đá.


chúng tôi chắc chắn có người điều hành có thể cấm người thao túng tiềm năng. tôi quan tâm nhiều hơn về thô tục. nó sẽ là một nhiệm vụ tẻ nhạt cho người điều hành khi, hầu hết các từ được sử dụng trong ngữ cảnh xấu sẽ lặp đi lặp lại.
naveen

Tôi chắc chắn rằng bạn có thể có các bộ lọc thô tục hoạt động để phát hiện những gì bạn có thể gọi là những thứ phổ biến và gắn cờ cho người kiểm duyệt. Không khó để đưa ra danh sách các từ "top 100", sau đó thực hiện một số mô hình khớp nhanh trên tất cả các chuỗi. Xóa tất cả dấu cách và dấu chấm trước để mọi người không C_H_E_A_T hoặc MANIPULATE thuật toán. Cuối cùng, mặc dù con người của nó sẽ làm điều đó đúng.
Tim Holt

3

Giải pháp đơn giản cho vấn đề:

  1. Xóa tất cả các dấu cách và dấu chấm câu từ đầu vào của bạn.
  2. Danh sách đen mọi thứ trong Từ điển đô thị .
  3. Danh sách đen tất cả các từ đồng âm, vv
  4. Danh sách đen tất cả mọi thứ có thể được sử dụng như một uyển ngữ.
  5. Viết phần mềm của bạn để hiểu nội dung, ý định và giai điệu của những gì còn lại.
  6. Vứt bỏ trò chơi và đi đến thị trường với sự sáng tạo đa cảm và toàn diện từ bước 5.

6
điện thoại homo lolololol
Jonathan Connell

3
Đây là kết quả cuối cùng của những kẻ gửi thư rác captcha người giải quyết và bộ lọc thư rác: AI tình cảm chiến đấu để kiểm soát Trái đất: một bên cố gắng bán Viagra và bên còn lại cố gắng bảo vệ Nhân loại. Rất Transformers. :-)
Zan Lynx

3

Một số MMO dành cho trẻ em chỉ cần thay thế trò chuyện bằng một danh sách các biểu tượng và cụm từ được xác định trước và đơn giản là không cho phép trò chuyện ở dạng tự do. Có lẽ trò chơi có thể được thiết kế để phù hợp với điều đó.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.