Tôi có một khóa học về Máy học trong học kỳ này và giáo sư yêu cầu chúng tôi tìm ra một vấn đề trong thế giới thực và giải quyết nó bằng một trong những phương pháp học máy được giới thiệu trong lớp, như:
- Cây quyết định
- Mạng lưới thần kinh nhân tạo
- Hỗ trợ máy Vector
- Học tập dựa trên sơ thẩm ( kNN , LWL )
- Mạng Bayes
- Học tăng cường
Tôi là một trong những người hâm mộ stackoverflow và stackexchange và biết rằng các cơ sở dữ liệu của các trang web này được cung cấp cho công chúng bởi vì chúng rất tuyệt vời! Tôi hy vọng tôi có thể tìm thấy một thách thức học máy tốt về các cơ sở dữ liệu này và giải quyết nó.
Ý kiến của tôi
Một ý tưởng xuất hiện trong đầu tôi là dự đoán các thẻ cho các câu hỏi dựa trên các từ đã nhập trong thân câu hỏi. Tôi nghĩ rằng mạng Bayes là công cụ phù hợp để học thẻ cho một câu hỏi nhưng cần nghiên cứu thêm. Dù sao, sau khi học xong khi người dùng hoàn thành việc nhập câu hỏi, một số thẻ nên được đề xuất cho anh ta.
Xin vui lòng cho tôi biết :
Tôi muốn hỏi cộng đồng thống kê như những người có kinh nghiệm về ML hai câu hỏi:
Bạn có nghĩ rằng đề xuất thẻ ít nhất là một vấn đề có bất kỳ cơ hội để giải quyết? Bạn có lời khuyên nào về nó không? Tôi hơi lo lắng vì stackexchange chưa thực hiện tính năng này.
Bạn có ý tưởng nào khác / tốt hơn cho dự án ML dựa trên cơ sở dữ liệu stackexchange không? Tôi thấy rất khó để tìm thấy thứ gì đó để học từ cơ sở dữ liệu stackexchange.
Cân nhắc về lỗi cơ sở dữ liệu: Tôi muốn chỉ ra rằng mặc dù cơ sở dữ liệu rất lớn và có nhiều trường hợp, nhưng chúng không hoàn hảo và dễ bị lỗi. Một điều hiển nhiên là tuổi của người dùng không đáng tin cậy. Ngay cả các thẻ được chọn cho câu hỏi không chính xác 100%. Dù sao, chúng ta nên xem xét tỷ lệ phần trăm chính xác của dữ liệu trong việc lựa chọn một vấn đề.
Cân nhắc về chính vấn đề: Dự án của tôi không nên về data-mining
hoặc một cái gì đó như thế này. Nó chỉ nên là một ứng dụng của các phương thức ML trong thế giới thực.