Tôi đang làm việc với Mô hình tuyến tính phân cấp Bayes , ở đây mạng mô tả nó.
đại diện cho doanh số hàng ngày của một sản phẩm trong siêu thị (quan sát).
là một ma trận các biến hồi quy đã biết, bao gồm giá cả, chương trình khuyến mãi, ngày trong tuần, thời tiết, ngày lễ.
là mức tồn kho tiềm ẩn chưa biết của mỗi sản phẩm, điều này gây ra nhiều vấn đề nhất và tôi coi đó là một vectơ của các biến nhị phân, một cho mỗi sản phẩm có 1 chỉ ra hàng tồn kho và do đó không có sản phẩm. Ngay cả khi trong lý thuyết chưa biết, tôi đã ước tính nó thông qua HMM cho mỗi sản phẩm, vì vậy nó được coi là X.Tôi chỉ quyết định làm sáng tỏ nó để có hình thức chính thức.
là một tham số tác dụng hỗn hợp cho bất kỳ sản phẩm duy nhất nơi mà hậu quả hỗn hợp được coi là giá thành sản phẩm, chương trình khuyến mãi và stockout.
là vector của các hệ số hồi quy cố định, trong khi b 1 và b 2 là các vectơ của hệ số hiệu ứng khác nhau. Một nhóm chỉthương hiệuvà nhóm còn lại biểu thịhương vị(đây là một ví dụ, trong thực tế tôi có nhiều nhóm, nhưng ở đây tôi chỉ báo cáo 2 cho rõ ràng).
, Σ b 1 và Σ b 2 là siêu tham số qua các hiệu ứng khác nhau.
Vì tôi đã đếm dữ liệu, hãy nói rằng tôi coi mỗi doanh số sản phẩm là Poisson phân phối có điều kiện trên Regressors (ngay cả đối với một số sản phẩm, phép tính gần đúng tuyến tính và đối với các sản phẩm khác thì mô hình bơm hơi bằng 0 là tốt hơn). Trong trường hợp như vậy tôi sẽ có một sản phẩm ( điều này chỉ dành cho những người quan tâm đến chính mô hình bayesian, bỏ qua câu hỏi nếu bạn thấy nó không thú vị hoặc không tầm thường :) ):
, α 0 , γ 0 , α 1 , γ 1 , α 2 , γ 2 tiếng.
, Σ beta được biết đến.
,
, j ∈ 1 , ... , m 1 , k ∈ 1 , ... , m 2
Ma trận Z i của các hiệu ứng hỗn hợp cho 2 nhóm, X p p s i chỉ giá, khuyến mãi và tồn kho của sản phẩm được xem xét. I W chỉ ra các phân phối Wishart nghịch đảo, thường được sử dụng cho ma trận hiệp phương sai của các linh mục đa biến thông thường. Nhưng nó không quan trọng ở đây. Một ví dụ về Z i có thể là ma trận của tất cả các giá hoặc thậm chí chúng ta có thể nói Z i = X i . Như liên quan các priors cho ma trận hỗn hợp tác dụng sai-hiệp phương sai, tôi sẽ chỉ cố gắng duy trì mối tương quan giữa các mục, do đó σ i j sẽ là tích cực nếu và j là sản phẩm của cùng một thương hiệu hoặc cùng một hương vị.
Trực giác đằng sau mô hình này sẽ là doanh số của một sản phẩm nhất định phụ thuộc vào giá của nó, tính sẵn có của nó hay không, mà còn phụ thuộc vào giá của tất cả các sản phẩm khác và hàng tồn kho của tất cả các sản phẩm khác. Vì tôi không muốn có cùng một mô hình (đọc: cùng đường cong hồi quy) cho tất cả các hệ số, tôi đã giới thiệu các hiệu ứng hỗn hợp khai thác một số nhóm tôi có trong dữ liệu của mình, thông qua chia sẻ tham số.
Câu hỏi của tôi là:
- Có cách nào để chuyển đổi mô hình này sang kiến trúc mạng thần kinh không? Tôi biết rằng có nhiều câu hỏi tìm kiếm mối quan hệ giữa mạng bayesian, trường ngẫu nhiên markov, mô hình phân cấp Bayes và mạng nơ ron, nhưng tôi không tìm thấy bất cứ điều gì từ mô hình phân cấp Bayes đến mạng lưới thần kinh. Tôi đặt câu hỏi về các mạng thần kinh vì có vấn đề về chiều cao của tôi (xem xét rằng tôi có 340 sản phẩm), việc ước tính tham số qua MCMC mất vài tuần (tôi đã thử chỉ 20 sản phẩm chạy chuỗi song song trong runJags và phải mất nhiều ngày) . Nhưng tôi không muốn đi ngẫu nhiên và chỉ cung cấp dữ liệu cho mạng thần kinh dưới dạng hộp đen. Tôi muốn khai thác cấu trúc phụ thuộc / độc lập của mạng của tôi.
Ở đây tôi chỉ phác thảo một mạng lưới thần kinh. Như bạn thấy, các biến hồi quy ( và S i chỉ ra giá tương ứng và hàng tồn kho của sản phẩm i ) ở trên cùng được nhập vào lớp ẩn như các sản phẩm cụ thể (Ở đây tôi đã xem xét giá và hàng tồn kho). (Các cạnh màu xanh và đen không có ý nghĩa đặc biệt, nó chỉ là để làm cho hình rõ hơn). Hơn nữa, và Y 2 có thể tương quan cao trong khi Y 3có thể là một sản phẩm hoàn toàn khác (nghĩ về 2 loại nước cam và rượu vang đỏ), nhưng tôi không sử dụng thông tin này trong các mạng lưới thần kinh. Tôi tự hỏi nếu thông tin nhóm được sử dụng chỉ trong việc vô hiệu hóa trọng lượng hoặc nếu một người có thể tùy chỉnh mạng cho vấn đề.
Chỉnh sửa, ý tưởng của tôi:
Ý tưởng của tôi sẽ giống như thế này: như trước đây, và Y 2 là các sản phẩm tương quan, trong khi Y 3 là một sản phẩm hoàn toàn khác. Biết điều này một tiên nghiệm tôi làm 2 việc:
- Tôi phân bổ một số tế bào thần kinh trong lớp ẩn cho bất kỳ nhóm nào tôi có, trong trường hợp này tôi có 2 nhóm {( ), ( Y 3 )}.
- Tôi khởi tạo trọng số cao giữa các đầu vào và các nút được phân bổ (các cạnh đậm) và tất nhiên tôi xây dựng các nút ẩn khác để nắm bắt 'tính ngẫu nhiên' còn lại trong dữ liệu.
Cảm ơn rất nhiều về sự trợ giúp của bạn