Tôi đang cố gắng hiểu làm thế nào mọi người rút ra Khả năng cho hồi quy tuyến tính đơn giản. Hãy nói rằng chúng ta chỉ có một tính năng x và kết quả y. Tôi không nghi ngờ biểu hiện với mật độ bình thường và tôi cũng không nghi ngờ rằng người ta có thể biến sản phẩm thành các yếu tố đơn giản hơn do tính độc lập. Tôi nghi ngờ làm thế nào mọi người rút ra biểu hiện này. Dường như có cả một sở thú (giả định một phần) về đầu vào và hầu như ở mọi nơi, bước quan trọng (namyle làm thế nào để lấy được sản phẩm có mật độ bình thường) trong đó người ta thực sự phải sử dụng các giả định chính xác bị bỏ qua :-(
Những gì tôi nghĩ là tự nhiên để giả định là như sau: Chúng tôi được cung cấp một bộ huấn luyện cố định và cho rằng
- các cặp trong tập huấn luyện cố định có độ dài đến từ các biến ngẫu nhiên được phân phối iid
- các là các biến một chiều iid ngẫu nhiên mỗi phân phối như với được biết đến (để đơn giản hóa) (có lẽ ta nên thừa nhận điều gì đó về mật độ có điều kiện ở đây? Mọi người dường như không chắc chắn những gì thực sự giả định ở đây ...)
Đặt và đặt . Bây giờ mục tiêu là xác định mật độ có điều kiện . Rõ ràng,
Câu hỏi:
Làm thế nào để tiến hành từ đây?
Tôi không thấy các giả định cung cấp thông tin về hoặc về vì vậy tôi chỉ đơn giản là không thể tính được đại lượng này . Ngoài ra, một số người có thể nghĩ rằng và thường được phân phối (hoặc thường được phân phối) có nghĩa là thường được phân phối, nhưng ...
Có một câu lệnh cho các biến ngẫu nhiên được phân phối bình thường nhưng nó sẽ như sau: Nếu được phân phối bình thường và là các ma trận cố định thì thường được phân phối lại. Trong trường hợp trên, là đó là không một ma trận liên tục.
Các nguồn khác dường như cho rằng thường được phân phối ngay lập tức. Đây dường như là một giả định kỳ lạ ... làm thế nào chúng ta có thể kiểm tra điều đó trên một tập dữ liệu thực?
Trân trọng + cảm ơn,
FW