Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu




1
Lý do trực quan đằng sau việc thực hiện các phép quay trong Phân tích nhân tố / PCA là gì và làm thế nào để chọn xoay vòng phù hợp?
Những câu hỏi của tôi Lý do trực quan đằng sau việc thực hiện luân chuyển các yếu tố trong phân tích nhân tố (hoặc các thành phần trong PCA) là gì? Sự hiểu biết của tôi là, nếu các biến được tải gần như bằng nhau trong các thành …

2
Tìm tứ phân vị trong R
Tôi đang làm việc thông qua sách giáo khoa thống kê khi học R và tôi gặp phải một vấp ngã trong ví dụ sau: Sau khi nhìn vào ?quantiletôi đã cố gắng tạo lại điều này trong R bằng cách sau: > nuclear <- c(7, 20, 16, 6, 58, …
33 r  quantiles 


8
Có thể loại bỏ các ngoại lệ khỏi dữ liệu?
Tôi đã tìm cách để loại bỏ các ngoại lệ khỏi bộ dữ liệu và tôi đã tìm thấy câu hỏi này . Tuy nhiên, trong một số ý kiến ​​và câu trả lời cho câu hỏi này, mọi người đã đề cập rằng việc loại bỏ các ngoại lệ …
33 outliers 

2
Mức độ tự do của trong bài kiểm tra Hosmer-Lemeshow
Thống kê thử nghiệm cho thử nghiệm Hosmer-Lemeshow (HLT) về mức độ phù hợp (GOF) của mô hình hồi quy logistic được định nghĩa như sau: Sau đó, mẫu được chia thành deciles, , mỗi decile sẽ tính các đại lượng sau:d=10d=10d=10D1,D2,…,DdD1,D2,…,DdD_1, D_2, \dots , D_{d} O1d=∑i∈DdyiO1d=∑i∈DdyiO_{1d}=\displaystyle \sum_{i \in D_d} …







2
Hiểu giá trị p
Tôi biết rằng có rất nhiều tài liệu giải thích giá trị p. Tuy nhiên, khái niệm này không dễ nắm bắt mà không cần làm rõ thêm. Dưới đây là định nghĩa về giá trị p từ Wikipedia: Giá trị p là xác suất để có được một thống …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.