Phát hiện các câu hỏi trùng lặp
Ngày xửa ngày xưa, có một địa điểm chơi gôn. Nó có một vấn đề: mọi người sẽ đăng câu hỏi tương tự hoặc giống hệt nhau nhiều lần. Bạn đã từnglựa chọn bắt buộc bị bắt buộc tống tiền được yêu cầu tự động hóa quá trình quyết định xem một câu hỏi có phải là một bản sao của câu hỏi hiện có hay không, bằng bất kỳ phương tiện nào cần thiết (xem Quy tắc).
Đầu vào
Chương trình của bạn phải chấp nhận một URL làm đầu vào. Nó có thể cho rằng điều này dẫn đến một câu hỏi trên codegolf.stackexchange.com .
Đầu ra
Tìm kiếm các trang web cho câu hỏi tương tự. Nếu bạn nghĩ rằng câu hỏi đầu vào là một bản sao của câu hỏi hiện có (hoặc ngược lại), hãy xuất URL của câu hỏi khác. Bạn có thể xuất nhiều URL, cách nhau bởi các dòng mới. Vào cuối đầu ra của bạn, đầu ra end
(trên một dòng riêng biệt).
Chấm điểm
- Nếu một câu hỏi mà bạn đưa ra thực sự được đánh dấu là một bản sao của câu hỏi đầu vào (hoặc ngược lại), bạn ghi được 4 điểm. Đây là một "dự đoán chính xác".
- Đối với mỗi dương tính giả (còn gọi là "đoán sai"), bạn mất 2 điểm.
- Đối với mỗi câu hỏi thực sự là một bản sao nhưng không xuất hiện trong đầu ra của bạn (hay còn gọi là "thiếu đoán"), mất 1 điểm.
Điểm cao nhất sau khi xử lý 32 câu hỏi đầu vào sẽ thắng. 32 câu hỏi này là một "vòng". Vào đầu mỗi vòng, điểm số sẽ được đặt lại về 0. Một vòng sẽ được chạy cứ sau vài ngày và bảng xếp hạng được cập nhật sau mỗi vòng.
Quy tắc
- Nếu cả hai câu hỏi A và C đều được đóng dưới dạng trùng lặp của B, A sẽ được tính là một bản sao của C và ngược lại.
- Khi bắt đầu mỗi vòng, chương trình của bạn có thể không có bất kỳ dữ liệu nào về bất kỳ câu hỏi nào (tức là không có mã hóa cứng ), ngoại trừ cách phân tích trang web.
- Tuy nhiên, bạn có thể giữ dữ liệu trong các tệp bên ngoài trong một vòng.
- Không có dữ liệu có thể được giữ giữa các vòng.
- Đầu ra của bạn phải có một dòng mới.
- Bạn không được sử dụng bất kỳ dữ liệu nào từ trang web ngoại trừ kết quả tìm kiếm và URL, tiêu đề, thẻ và văn bản của câu hỏi , có hoặc không có định dạng. Ví dụ: bạn không được sử dụng văn bản "được đánh dấu là trùng lặp bởi foo, bar ..." xuất hiện trên các câu hỏi trùng lặp.
- Bạn có thể truy xuất dữ liệu này trực tiếp từ trang web, qua data.SE hoặc qua API.
- Mỗi bài nộp phải có một tên.
- Mỗi bài nộp phải có đánh số phiên bản rõ ràng.
- Nếu một bài nộp không tạo ra đầu ra sau một thời gian giới hạn (sẽ được quyết định; vui lòng cho biết bài nộp của bạn mất bao lâu), nó sẽ bị giết và mất 8 điểm.