So sánh các hệ số hồi quy của cùng một mô hình trên các tập dữ liệu khác nhau


12

Tôi đang đánh giá hai (2) chất làm lạnh (khí) được sử dụng trong cùng một hệ thống lạnh. Tôi có dữ liệu nhiệt độ hút bão hòa ( ), nhiệt độ ngưng tụ ( ) và dữ liệu cường độ dòng điện ( ) để đánh giá. Có hai (2) bộ dữ liệu; Chất làm lạnh thứ 1 ( ) & chất làm lạnh thứ 2 ( ). Tôi đang sử dụng mô hình đa thức tuyến tính, đa biến ( & ), thứ ba cho các phân tích hồi quy. Tôi muốn xác định trung bình ít hơn / nhiều cường độ (hoặc, một số liệu tương tự như so sánh hiệu suất) trung bình, tính theo phần trăm, được rút ra bởi chất làm lạnh thứ hai.D YSDYR 2 S DR1R2SD

Suy nghĩ đầu tiên của tôi là:

  1. Xác định mô hình sẽ sử dụng:Y=b0+b1S+b2D+b3SD+b4S2+b5D2+b6S2D+b7D2S+b8D3+b9S3
  2. Các hệ số ( ) từ dữ liệu cơ sở ( ).R 1biR1
  3. Sử dụng các hệ số đó, cho mỗi & trong bộ dữ liệu , hãy tính toán mỗi lần rút amp dự kiến ​​( ) và sau đó là trung bình.DSDYR2Y^
  4. So sánh trung bình với mức rút amp trung bình thực tế ( ) của dữ liệu . Y2R2Y^Y2R2
  5. percent (%) change=(Y2Y^)/Y^

Tuy nhiên, vì chất làm lạnh thứ 2 có các tính chất nhiệt hơi khác nhau và các thay đổi nhỏ đã được thực hiện đối với hệ thống làm lạnh (TXV & điều chỉnh quá nhiệt) Tôi không tin rằng 'phương pháp so sánh cơ bản' này là chính xác.

Suy nghĩ tiếp theo của tôi là thực hiện hai (2) phân tích hồi quy riêng:

Y1=a0+a1S1+a2D1+a3S1D1+a4S12+a5D12+a6S12D1+a7D12S1+a8D13+a9S13Y2=b0+b1S2+b2D2+b3S2D2+b4S22+b5D22+b6S22D2+b7D22S2+b8D23+b9S23

và sau đó, đối với nhiệt độ hút bão hòa ( ), hãy so sánh các hệ số ( so với ) như vậy: a 1 b 1Sa1b1

% change=b1a1a1

Tuy nhiên, một lần nữa, các hệ số này nên được tính trọng số khác nhau. Do đó, kết quả sẽ bị sai lệch.

Tôi tin rằng tôi có thể sử dụng kiểm tra z để xác định các hệ số có trọng số khác nhau như thế nào, nhưng tôi không chắc mình hiểu đầy đủ ý nghĩa của đầu ra: . Nhưng, điều đó vẫn không cho tôi một thước đo hiệu suất, đó là mục tiêu tổng thể.z=(a1b1)/SEa12+SEb12)


1
1. Mô hình đa thức là mô hình tuyến tính, vì nó là tuyến tính trong hệ số. 2. Tôi đang cố gắng để hiểu câu hỏi của bạn. Nếu hệ thống làm lạnh đã được sửa đổi trong khoảng thời gian R1 và R2 được sử dụng, thì chúng thực sự không phải là 'cùng một hệ thống làm lạnh' (dòng 1), phải không? 3. Tại sao trong cách tiếp cận thứ hai của bạn, bạn bắt đầu so sánh các hệ số của S? 4. Bạn có cân nhắc giới thiệu một 'chất làm lạnh' đồng biến với các mức R1 và R2 vào mức phù hợp đa thức (có thể có tương tác) không? Hệ số của nó có thể trả lời câu hỏi.
qoheleth

@qoheleth 1. Không chắc chắn tôi theo dòng suy nghĩ của bạn ... Hệ số luôn tuyến tính - đó là một con số. Khi nào thì hệ số sẽ không tuyến tính? 2. Chính xác, hệ thống làm lạnh đã được thay đổi NHANH CHÓNG, nhưng chỉ để đảm bảo cùng nhiệt độ đầu ra cho cả hai chất làm lạnh - "táo để táo". 3. 'S' là biến quan tâm duy nhất cho so sánh cụ thể này. 4. Tôi đã đọc về phương pháp biến số đồng biến / tương tác, nhưng không hiểu ý nghĩa của các hệ số sử dụng phương pháp đó. Bạn có thể giải thích về việc diễn giải đầu ra? Cảm ơn bạn.
gth826a

1. từ quan điểm thống kê, tuyến tính trong những điều bạn đang ước tính là những gì được tính, vì vậy một mô hình đa thức là tuyến tính. Một ví dụ về mô hình phi tuyến tính sẽ là hàm mitscherlich y = alpha (1-exp (beta-lambda * X)), trong đó alpha / beta / lambda là những gì chúng ta đang ước tính. 3. Bạn thực sự đang cố gắng thử nghiệm điều gì? nó có phải là hệ số của S không? hay Y Nếu là S, tại sao lần đầu tiên bạn thử so sánh trong \ hat {Y}?
qoheleth

Y-hat sẽ là: S & D thực tế từ tập dữ liệu thứ 2 được sử dụng với các coeff được lấy từ tập dữ liệu thứ nhất. Phương pháp này là phổ biến cho các phân tích năng lượng của 'Hợp đồng hiệu suất' khi so sánh mức tiêu thụ năng lượng của thiết bị trước đó với mức tiêu thụ năng lượng sau khi trang bị thêm / tu sửa / cải tạo / v.v. Phương trình sẽ là: tiêu thụ năng lượng = y-hat = baseload + năng lượng / ngày-độ * ngày ... trong đó năng lượng / độ-ngày là coeff có được từ phân tích hồi quy cơ sở và ngày độ là từ đổi mới sau . "Bạn sẽ tiêu thụ những gì" nếu bạn không thực hiện kịch bản dự án này ...
gth826a

1
Vì vậy, có vẻ như cuối cùng bạn muốn so sánh Y. Tôi sẽ quên việc tính% thay đổi trong các hệ số, với sự có mặt của các điều khoản bậc cao hơn (S ^ 2, S ^ 3, v.v.), các hệ số không như bạn nghĩ họ đang. Tập trung vào Y. Câu hỏi còn lại chưa rõ ràng với tôi là, bạn đang nói S & D trong R2 có nghĩa là những điều khác nhau đối với S & D ở R1? Nếu không, thì bạn có thể chỉ cần khớp một mô hình với tập dữ liệu kết hợp, với một biến số cộng (biến X) gọi là môi chất lạnh (r1 hoặc r2) và xem xét hệ số của nó để suy luận, giả sử mô hình của bạn là đủ.
qoheleth

Câu trả lời:


2

Từ luật khí lý tưởng ở đây , , đề xuất một mô hình tỷ lệ. Hãy chắc chắn rằng các đơn vị của bạn đang ở nhiệt độ tuyệt đối. Yêu cầu một kết quả tỷ lệ sẽ ngụ ý một mô hình lỗi tỷ lệ. Hãy xem xét, có lẽ , sau đó để hồi quy tuyến tính nhiều người ta có thể sử dụng bằng cách lấy logarit của các giá trị Y, D và S, do đó, giá trị này trông giống như , trong đó các chỉ số có nghĩa là "logarit của." Bây giờ, điều này có thể hoạt động tốt hơn mô hình tuyến tính bạn đang sử dụng và câu trả lời là loại lỗi tương đối.Y = a D b S c ln ( Y ) = ln ( a ) + b ln ( D ) + c ln ( S ) Y l = a l + b D l + cPV=nRTY=aDbScln(Y)=ln(a)+bln(D)+cln(S)Yl=al+bDl+cSll

Để xác minh loại mô hình sẽ sử dụng, hãy thử một và kiểm tra xem phần dư có phải là homoscedastic không. Nếu chúng không phải là mô hình thiên vị , thì hãy làm một cái gì đó khác như mô hình logarit, như trên, một hoặc nhiều đối ứng của dữ liệu x hoặc y, căn bậc hai, bình phương, lũy thừa và cứ thế cho đến khi phần dư là đồng nhất. Nếu mô hình không thể mang lại số dư homoscedastic thì sử dụng nhiều hồi quy Theil tuyến tính, với kiểm duyệt nếu cần.

Làm thế nào thông thường dữ liệu được phân phối trên trục y là không bắt buộc, nhưng, các ngoại lệ có thể và thường làm sai lệch kết quả tham số hồi quy rõ rệt. Nếu không thể tìm thấy đồng đẳng thì không nên sử dụng bình phương tối thiểu thông thường và một số loại hồi quy khác, ví dụ hồi quy có trọng số, hồi quy Theil, bình phương nhỏ nhất trong x, hồi quy Deming, v.v. Ngoài ra, các lỗi không nên tương quan huyết thanh.

Ý nghĩa của đầu ra: , có thể hoặc không liên quan, thích hợp. Điều này giả định rằng tổng phương sai là tổng của hai phương sai độc lập. Nói cách khác, tính độc lập là tính trực giao (vuông góc) trên một biểu đồ . Nghĩa là, tổng biến thiên (phương sai) sau đó tuân theo định lý Pythagore, , có thể hoặc không thể là trường hợp cho dữ liệu của bạn. Nếu đó là trường hợp, thì -statistic là một khoảng cách tương đối, nghĩa là sự khác biệt của phương tiện (khoảng cách), chia cho Pythagore, vectơ AKA, thêm sai số chuẩn (SE), là độ lệch chuẩn (SD) được chia bởiz=(a1b1)/SEa12+SEb12)x,yH=+A2+O2zN, nơi SE là chính mình khoảng cách. Chia một khoảng cách cho nhau sau đó bình thường hóa chúng, nghĩa là, sự khác biệt về phương tiện chia cho tổng lỗi (tiêu chuẩn), sau đó ở dạng để người ta có thể áp dụng ND (0,1) để tìm xác suất.

Bây giờ, điều gì xảy ra nếu các biện pháp không độc lập, và làm thế nào người ta có thể kiểm tra nó? Bạn có thể nhớ từ hình học rằng các tam giác không vuông góc thêm các cạnh của chúng là , nếu không làm mới bộ nhớ của bạn ở đây . Đó là, khi có một cái gì đó khác với góc 90 độ giữa các trục, chúng ta phải bao gồm góc đó là gì trong tính toán tổng khoảng cách. Đầu tiên nhớ lại mối tương quan là gì, hiệp phương sai chuẩn hóa. Điều này cho tổng khoảng cách và tương quan trở thànhσ T ρ Một , B σ 2 T = σ 2 Một + σ 2 B - 2 σ Một σ B ρ Một , BC2=A2+B22ABcos(θ),θ=(A,B)σTρA,BσT2=σA2+σB22σAσBρA,B. Nói cách khác, nếu độ lệch chuẩn của bạn có tương quan (ví dụ: cặp đôi), thì chúng không độc lập.


"Để xác minh loại mô hình nào sẽ sử dụng, hãy thử một loại và kiểm tra xem phần dư có phải là homoscedastic không", vâng chắc chắn ... ngoại trừ bạn hoàn toàn không đưa ra giả định này và ngay cả khi nó hợp lệ - không có cách nào đảm bảo rằng bạn có một mô hình "tốt".
Repmat

Nếu một người sử dụng OLS và phần dư là không đồng nhất, thì chắc chắn người ta có một mô hình sai lệch. Homoscedasticity là một yêu cầu OLS, được hiển thị ở đây . Để có một mô hình tốt đòi hỏi các điều kiện khác, như tránh sai lệch biến bị bỏ qua , nhưng có các lỗi không tương quan nối tiếp và tuyến tính của mô hình so với biến phụ thuộc.
Carl

Bạn có thể có một mô hình không thiên vị và / hoặc nhất quán (ước tính) trong đó phần dư là không đồng nhất. Điều đó chỉ ngụ ý rằng các quy trình suy luận thông thường không hoạt động
Repmat

Sự không đồng nhất làm phẳng độ dốc, ngay cả khi một ngoại lệ đã sửa lỗi này, hình phạt sẽ là khoảng tin cậy lớn và một mô hình tệ hại. Sẽ không sử dụng một mô hình như vậy, nhưng, vâng, người ta có thể tạo ra các mô hình tệ hại. Các tài liệu y khoa là đầy đủ của họ.
Carl

Phần đầu tiên của bình luận của bạn chỉ đơn giản là sai. Tôi thậm chí không chắc nó có nghĩa gì.
Repmat
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.