Thống kê và dữ liệu lớn

1

Định nghĩa của "không gian tính năng" là gì? Ví dụ: Khi đọc về các SVM, tôi đọc về "ánh xạ tới không gian đặc trưng". Khi đọc về GIỎ HÀNG, tôi đọc về "phân vùng theo không gian đặc trưng". Tôi hiểu những gì đang xảy ra, đặc biệt …

18 machine-learning svm feature-selection cart feature-construction

1

Khi nào nên chọn SARSA so với Q Learning

SARSA và Q Learning đều là các thuật toán học tăng cường hoạt động theo cách tương tự. Sự khác biệt nổi bật nhất là SARSA nằm trong chính sách trong khi Q Learning không có chính sách. Các quy tắc cập nhật như sau: Học Q: Q(st,at)←Q(st,at)+α[rt+1+γmaxa′Q(st+1,a′)−Q(st,at)]Q(st,at)←Q(st,at)+α[rt+1+γmaxa′Q(st+1,a′)−Q(st,at)]Q(s_t,a_t)←Q(s_t,a_t)+α[r_{t+1}+γ\max_{a'}Q(s_{t+1},a')−Q(s_t,a_t)] SARSA: Q(st,at)←Q(st,at)+α[rt+1+γQ(st+1,at+1)−Q(st,at)]Q(st,at)←Q(st,at)+α[rt+1+γQ(st+1,at+1)−Q(st,at)]Q(s_t,a_t)←Q(s_t,a_t)+α[r_{t+1}+γQ(s_{t+1},a_{t+1})−Q(s_t,a_t)] …

18 reinforcement-learning

3

Sự khác biệt giữa Conv1D và Conv2D là gì?

Tôi đã xem qua các tài liệu tích chập của máy ảnh và tôi đã tìm thấy hai loại kết hợp Conv1D và Conv2D. Tôi đã thực hiện một số tìm kiếm trên web và đây là những gì tôi hiểu về Conv1D và Conv2D; Conv1D được sử dụng cho …

18 machine-learning neural-networks conv-neural-network keras

4

Tại sao sử dụng nhãn giả không ảnh hưởng đến kết quả?

Tôi đã xem xét các phương pháp học bán giám sát và đã bắt gặp khái niệm "dán nhãn giả". Theo tôi hiểu, với việc gắn nhãn giả, bạn có một bộ dữ liệu được gắn nhãn cũng như một bộ dữ liệu chưa được gắn nhãn. Trước tiên, bạn …

18 machine-learning semi-supervised

2

Điều gì gây ra sự sụt giảm đột ngột trong các lỗi đào tạo / kiểm tra khi đào tạo một mạng lưới thần kinh?

Tôi đã thấy các âm mưu của lỗi kiểm tra / huấn luyện đột nhiên giảm xuống ở một số kỷ nguyên nhất định một vài lần trong quá trình đào tạo mạng lưới thần kinh và tôi tự hỏi điều gì gây ra những bước nhảy hiệu suất này: …

18 conv-neural-network

2

Giải thích trực quan về cách UMAP hoạt động, so với t-SNE

Tôi có bằng tiến sĩ sinh học phân tử. Các nghiên cứu của tôi gần đây đã bắt đầu liên quan đến phân tích dữ liệu chiều cao. Tôi có ý tưởng về cách thức hoạt động của t-SNE (nhờ video StatQuest trên YouTube ) nhưng dường như tôi không …

18 dimensionality-reduction intuition tsne

3

Kiểm tra dữ liệu được tạo ngẫu nhiên theo phân phối dự định của nó

Tôi đã viết một chương trình tạo dữ liệu ngẫu nhiên. Nếu chương trình hoạt động chính xác, dữ liệu đó phải tuân theo phân phối xác suất cụ thể, đã biết. Tôi muốn chạy chương trình, thực hiện một số tính toán về kết quả và đưa ra giá …

17 distributions hypothesis-testing random-generation

1

Trong ví dụ 8 trường của Gelman, tại sao lỗi tiêu chuẩn của ước tính cá nhân được giả định đã biết?

Bối cảnh: Trong ví dụ 8 trường của Gelman (Phân tích dữ liệu Bayes, ấn bản thứ 3, Ch 5.5), có tám thí nghiệm song song ở 8 trường thử nghiệm hiệu quả của việc huấn luyện. Mỗi thí nghiệm mang lại một ước tính cho hiệu quả của huấn …

17 bayesian hierarchical-bayesian

2

phân loại một biến biến nó từ không đáng kể thành quan trọng

Tôi có một biến số hóa ra không đáng kể trong mô hình hồi quy logistic đa biến. Tuy nhiên, khi tôi phân loại nó thành các nhóm, đột nhiên nó trở nên quan trọng. Điều này rất trực quan với tôi: khi phân loại một biến, chúng tôi cung …

17 regression logistic statistical-significance multivariate-analysis

1

Stepwise AIC - Có tồn tại tranh cãi xung quanh chủ đề này?

Tôi đã đọc vô số bài đăng trên trang web này cực kỳ chống lại việc sử dụng các biến số theo từng bước bằng cách sử dụng bất kỳ tiêu chí nào cho dù đó là giá trị p, AIC, BIC, v.v. Tôi hiểu tại sao các thủ tục …

17 forecasting predictive-models arima aic stepwise-regression

3

Sự khác biệt giữa một thí nghiệm thống kê của người Viking và mô hình thống kê của người khác là gì?

Tôi đang theo dõi AW van der Vaart, thống kê tiệm cận (1998). Ông nói về các thí nghiệm thống kê, cho rằng chúng khác với mô hình thống kê, nhưng ông không định nghĩa. Câu hỏi của tôi: (1) thí nghiệm thống kê là gì, (2) mô hình thống …

17 mathematical-statistics inference experiment-design descriptive-statistics model

2

Tại sao chữ Q được chọn trong Q-learning?

Tại sao chữ Q được chọn trong tên của Q-learning? Hầu hết các chữ cái được chọn là một từ viết tắt, chẳng hạn như viết tắt của ππ\pi cho chính sách và vvv là viết tắt của giá trị. Nhưng tôi không nghĩ Q là từ viết tắt của …

17 terminology reinforcement-learning history q-learning

3

Tại sao không sử dụng các phương trình bình thường của người Viking để tìm các hệ số bình phương nhỏ nhất đơn giản?

Tôi thấy danh sách này ở đây và không thể tin rằng có rất nhiều cách để giải các hình vuông nhỏ nhất. "Phương trình bình thường" trên Wikipedia dường như là một cách khá đơn giản: α^β^= y¯- β^x¯,= ∑ni = 1( xTôi- x¯)(yi−y¯)∑ni=1(xi−x¯)2α^=y¯-β^x¯,β^= =ΣTôi= =1n(xTôi-x¯)(yTôi-y¯)ΣTôi= =1n(xTôi-x¯)2 {\displaystyle {\begin{aligned}{\hat …

17 regression least-squares scikit-learn

3

Làm thế nào có thể có được một mô hình hồi quy tuyến tính tốt khi không có mối tương quan đáng kể giữa đầu ra và các yếu tố dự đoán?

Tôi đã đào tạo một mô hình hồi quy tuyến tính, sử dụng một tập hợp các biến / tính năng. Và mô hình có một hiệu suất tốt. Tuy nhiên, tôi đã nhận ra rằng không có biến nào có tương quan tốt với biến dự đoán. Làm thế …

17 regression machine-learning correlation multiple-regression linear-model

2

LASSO và sườn núi từ quan điểm Bayes: còn thông số điều chỉnh thì sao?

Công cụ ước tính hồi quy hình phạt như LASSO và sườn núi được cho là tương ứng với công cụ ước tính Bayes với một số linh mục nhất định. Tôi đoán (vì tôi không biết đủ về thống kê Bayes) rằng đối với một tham số điều chỉnh …

17 bayesian lasso ridge-regression