Thống kê và dữ liệu lớn

1

Howlers gây ra bằng cách sử dụng hồi quy từng bước

Tôi nhận thức rõ các vấn đề của lựa chọn từng bước / tiến / lùi trong các mô hình hồi quy. Có rất nhiều trường hợp các nhà nghiên cứu tố cáo các phương pháp và chỉ ra các lựa chọn thay thế tốt hơn. Tôi tò mò liệu …

20 regression stepwise-regression history

5

Lăn một con súc sắc cho đến khi nó rơi vào bất kỳ số nào ngoài 4. Xác suất kết quả là> 4 là bao nhiêu?

Một người chơi được cho một cái chết sáu mặt công bằng. Để giành chiến thắng, cô phải quay một số lớn hơn 4 (tức là 5 hoặc 6). Nếu cô ấy lăn 4, cô ấy phải lăn lại. Tỷ lệ thắng của cô ấy là gì? Tôi nghĩ rằng …

20 probability

1

MCMC thích ứng có thể được tin cậy?

Tôi đang đọc về MCMC thích ứng (xem, ví dụ, Chương 4 của Sổ tay của Markov Chain Monte Carlo , biên tập Brooks và cộng sự, 2011; và cả Andrieu & Thoms, 2008 ). Kết quả chính của Roberts và Rosenthal (2007) là nếu sơ đồ thích ứng thỏa …

20 simulation mcmc random-generation metropolis-hastings

1

Các quá trình gaussian miền Wavelet: hiệp phương sai là gì?

Tôi đã đọc Maunun và cộng sự , "Các quá trình Gaussian không cố định trong miền sóng con: Tổng hợp, ước tính và thử nghiệm quan trọng" (2007) định nghĩa một lớp GP không cố định có thể được chỉ định bởi các bội số trong miền sóng con. …

20 normal-distribution stochastic-processes gaussian-process fourier-transform wavelet

1

Làm thế nào chúng ta có thể mô phỏng từ một hỗn hợp hình học?

Nếu là các mật độ đã biết mà từ đó tôi có thể mô phỏng, tức là có sẵn một thuật toán. và nếu sản phẩm có thể tích hợp được, thì có cách tiếp cận chung để mô phỏng từ mật độ sản phẩm này bằng cách sử dụng …

20 simulation monte-carlo geometric-mean scalability finite-mixture-model

3

Để tối đa hóa cơ hội đoán chính xác kết quả của việc lật đồng xu, tôi có nên luôn luôn chọn kết quả có thể xảy ra nhất không?

Đây không phải là bài tập về nhà. Tôi quan tâm đến việc hiểu nếu logic của tôi là đúng với vấn đề thống kê đơn giản này. Giả sử tôi có một đồng xu 2 mặt trong đó xác suất lật đầu là P(H)P(H)P(H) và xác suất lật đuôi …

20 probability

1

Bằng chứng về việc thu hẹp các hệ số bằng cách sử dụng hồi quy sườn thông qua phân rã phổ

Tôi đã hiểu làm thế nào hồi quy sườn núi thu nhỏ các hệ số về không về mặt hình học. Hơn nữa, tôi biết làm thế nào để chứng minh điều đó trong "Trường hợp đặc biệt", nhưng tôi bối rối không biết nó hoạt động như thế nào …

20 regression multiple-regression regularization ridge-regression svd

7

Tại sao ma trận xác định dương tính đối xứng (SPD) rất quan trọng?

Tôi biết định nghĩa của ma trận xác định dương tính đối xứng (SPD), nhưng muốn hiểu thêm. Tại sao chúng rất quan trọng, bằng trực giác? Đây là những gì tôi biết. Còn gì nữa không Đối với một dữ liệu nhất định, ma trận Co-variance là SPD. Ma …

20 mathematical-statistics optimization covariance-matrix intuition linear-algebra

3

Tại sao AUC = 1 thậm chí phân loại đã phân loại sai một nửa số mẫu?

Tôi đang sử dụng một bộ phân loại trả về xác suất. Để tính toán AUC, tôi đang sử dụng gói RROC. Các xác suất đầu ra từ phân loại là: probs=c(0.9865780, 0.9996340, 0.9516880, 0.9337157, 0.9778576, 0.8140116, 0.8971550, 0.8967585, 0.6322902, 0.7497237) probscho thấy xác suất vào lớp '1'. Như được …

20 machine-learning auc

4

Mã hóa dữ liệu góc cho mạng thần kinh

Tôi đang đào tạo một mạng lưới thần kinh (chi tiết không quan trọng) trong đó dữ liệu đích là một vectơ góc (trong khoảng từ 0 đến 2 * pi). Tôi đang tìm kiếm lời khuyên về cách mã hóa dữ liệu này. Đây là những gì tôi hiện …

20 neural-networks circular-statistics

4

Sự khác biệt giữa học tập và suy luận là gì?

Các tài liệu nghiên cứu về máy học thường coi việc học và suy luận là hai nhiệm vụ riêng biệt, nhưng đối với tôi không rõ sự khác biệt là gì. Trong cuốn sách này, ví dụ họ sử dụng số liệu thống kê Bayes cho cả hai loại …

20 machine-learning terminology

9

Làm thế nào để chúng ta biết rằng xác suất cán 1 và 2 là 1/18?

Kể từ lớp xác suất đầu tiên của tôi, tôi đã tự hỏi về những điều sau đây. Tính toán xác suất thường được giới thiệu thông qua tỷ lệ của "sự kiện ưa thích" trên tổng số sự kiện có thể. Trong trường hợp lăn hai con xúc xắc …

20 probability dice

1

Nếu LASSO tương đương với hồi quy tuyến tính với Laplace trước thì làm sao có thể có khối lượng trên các tập hợp với các thành phần bằng 0?

Tất cả chúng ta đều quen thuộc với khái niệm, được ghi lại trong tài liệu, rằng tối ưu hóa LASSO (vì đơn giản là chú ý đến trường hợp hồi quy tuyến tính) tương đương với mô hình tuyến tính có lỗi Gaussian trong đó các tham số được …

20 lasso laplace-distribution

1

Splines có thể được sử dụng để dự đoán?

Tôi không thể cụ thể về bản chất của dữ liệu vì nó là độc quyền, nhưng giả sử chúng tôi có dữ liệu như thế này: Mỗi tháng, một số người đăng ký dịch vụ. Sau đó, trong mỗi tháng tiếp theo, những người đó có thể nâng cấp …

20 panel-data splines mars

5

Tại sao chúng ta sử dụng công thức độ lệch chuẩn sai lệch và sai lệch cho của phân phối bình thường?

Tôi cảm thấy hơi sốc khi lần đầu tiên tôi thực hiện mô phỏng Monte Carlo phân phối bình thường và phát hiện ra rằng giá trị trung bình của độ lệch chuẩn từ mẫu, tất cả đều có cỡ mẫu chỉ , được chứng minh là ít hơn nhiều …

20 normal-distribution standard-deviation expected-value unbiased-estimator umvue