Thống kê và dữ liệu lớn

3

Tạo động lực cho các đơn vị sản lượng sigmoid trong các mạng thần kinh bắt đầu với xác suất log unnormalized tuyến tính trong

Bối cảnh: Tôi đang học chương 6 của Deep Learning của Ian Goodfellow và Yoshua Bengio và Aaron Courville. Trong phần 6.2.2.2 (trang 182 trên 183 có thể xem tại đây ) việc sử dụng sigmoid để xuất được thúc đẩy.P(y=1|x)P(y=1|x)P(y=1|x) Để tóm tắt một số tài liệu họ cho …

12 neural-networks deep-learning

2

Làm thế nào để giảm thiểu độ dốc giảm dần cập nhật trọng số cho từng ví dụ trong một lô?

Nếu chúng tôi xử lý 10 ví dụ trong một đợt, tôi hiểu rằng chúng tôi có thể tính tổng tổn thất cho mỗi ví dụ, nhưng làm thế nào để truyền bá hoạt động liên quan đến việc cập nhật các trọng số cho mỗi ví dụ? Ví dụ: …

12 neural-networks gradient-descent backpropagation tensorflow

3

Làm cách nào để chạy hồi quy tuyến tính theo cách song song / phân tán cho cài đặt dữ liệu lớn?

Tôi đang làm việc với một vấn đề hồi quy tuyến tính rất lớn, với kích thước dữ liệu lớn đến mức chúng phải được lưu trữ trên một cụm máy. Sẽ là quá lớn để tổng hợp tất cả các mẫu vào một bộ nhớ của một máy (thậm …

12 regression linear large-data

3

Có một vấn đề nghiêm trọng với việc bỏ các quan sát với các giá trị bị thiếu khi tính toán ma trận tương quan?

Tôi có bộ dữ liệu khổng lồ này với 2500 biến và thích 142 quan sát. Tôi muốn chạy một mối tương quan giữa Biến X và phần còn lại của các biến. Nhưng đối với nhiều cột, có những mục bị thiếu. Tôi đã cố gắng thực hiện điều …

12 r correlation missing-data correlation-matrix

2

Máy ảnh: tại sao tổn thất giảm trong khi val_loss tăng?

Tôi thiết lập một tìm kiếm lưới cho một loạt các params. Tôi đang cố gắng tìm các tham số tốt nhất cho mạng lưới thần kinh Keras có phân loại nhị phân. Đầu ra là 1 hoặc 0. Có khoảng 200 tính năng. Khi tôi thực hiện tìm kiếm …

12 machine-learning cross-validation deep-learning tensorflow theano

2

Hạn chế maxnorm là gì? Nó hữu ích như thế nào trong Mạng nơ ron kết hợp?

Dưới đây là một mẫu mã máy ảnh sử dụng nó: from keras.constraints import max_norm model.add(Convolution2D(32, 3, 3, input_shape=(3, 32, 32), border_mode='same', activation='relu', kernel_constraint=max_norm(3)))

12 neural-networks regularization conv-neural-network optimization

2

Trực giác toán học của phương trình Bias-Variance

Gần đây tôi đã hỏi một câu hỏi tìm cách giải thích / trực giác toán học đằng sau phương trình cơ bản liên quan đến trung bình và phương sai mẫu: , hình học hoặc cách khác.E[ X2] = Vmột r ( X) + ( E[ X] )2E[X2]=Var(X)+(E[X])2 E[X^2] …

12 variance bias

1

Tại sao lm và biglm trong R cung cấp các giá trị p khác nhau cho cùng một dữ liệu?

Đây là một ví dụ nhỏ: MyDf<-data.frame(x=c(1,2,3,4), y=c(1.2, .7, -.5, -3)) Bây giờ với base::lm: > lm(y~x, data=MyDf) %>% summary Call: lm(formula = y ~ x, data = MyDf) Residuals: 1 2 3 4 -0.47 0.41 0.59 -0.53 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 3.0500 0.8738 3.491 0.0732 …

12 r regression p-value linear-model

2

Sự khác biệt giữa hồi quy tuyến tính 'thường xuyên' và hồi quy tuyến tính học sâu là gì?

Tôi muốn biết sự khác biệt giữa hồi quy tuyến tính trong phân tích máy học thông thường và hồi quy tuyến tính trong cài đặt "học sâu". Những thuật toán được sử dụng cho hồi quy tuyến tính trong cài đặt học tập sâu.

12 regression machine-learning deep-learning

4

Trong CNN, việc ghép mẫu và chuyển vị chập có giống nhau không?

Cả hai thuật ngữ "tăng tốc" và "tích chập chuyển vị" đều được sử dụng khi bạn thực hiện "giải mã" (<- không phải là một thuật ngữ tốt, nhưng hãy để tôi sử dụng nó ở đây). Ban đầu, tôi nghĩ rằng chúng có cùng ý nghĩa, nhưng dường …

12 machine-learning neural-networks conv-neural-network transposed-convolution

3

Làm thế nào để thực hiện một mô hình hỗn hợp bằng cách sử dụng hàm betareg trong R?

Tôi có một bộ dữ liệu bao gồm các tỷ lệ đo "mức độ hoạt động" của nòng nọc riêng lẻ, do đó làm cho các giá trị bị ràng buộc trong khoảng từ 0 đến 1. Dữ liệu này được thu thập bằng cách đếm số lần cá nhân …

12 r mixed-model random-effects-model beta-distribution beta-regression

1

Chính xác thì khối Học tập còn lại trong bối cảnh Mạng lưới cư trú sâu trong Học tập sâu là gì?

Tôi đang đọc bài viết Học tập dư thừa sâu để nhận dạng hình ảnh và tôi gặp khó khăn trong việc hiểu chắc chắn 100% những gì một khối còn lại đòi hỏi tính toán. Đọc bài báo của họ, họ có hình 2: trong đó minh họa những …

12 machine-learning neural-networks deep-learning conv-neural-network residual-networks

1

Sự khác biệt giữa triển khai PCA và TruncatedSVD

Tôi hiểu mối quan hệ giữa Phân tích thành phần chính và Phân tách giá trị số đơn ở cấp độ đại số / chính xác. Câu hỏi của tôi là về việc thực hiện scikit-learn . Tài liệu nói: " [TruncatedSVD] rất giống với PCA, nhưng hoạt động trực …

12 pca scikit-learn svd scipy

2

tối ưu hóa auc vs logloss trong các vấn đề phân loại nhị phân

Tôi đang thực hiện một nhiệm vụ phân loại nhị phân trong đó xác suất kết quả là khá thấp (chiếm 3%). Tôi đang cố gắng quyết định nên tối ưu hóa bằng AUC hay mất log. Theo như tôi đã hiểu, AUC tối đa hóa khả năng phân biệt …

12 classification binary-data auc log-loss

1

Giải thích các hệ số hồi quy LASSO

Tôi hiện đang làm việc để xây dựng một mô hình dự đoán cho kết quả nhị phân trên tập dữ liệu với ~ 300 biến và 800 quan sát. Tôi đã đọc nhiều trên trang web này về các vấn đề liên quan đến hồi quy từng bước và …

12 multiple-regression predictive-models interpretation regression-coefficients lasso