Gần đây tôi có một khách hàng đến gặp tôi để thực hiện phân tích bootstrap vì một nhà phê bình của FDA nói rằng hồi quy lỗi trong biến của họ là không hợp lệ vì khi gộp dữ liệu từ các trang web, phân tích bao gồm dữ liệu gộp từ ba trang web trong đó hai trang web có một số mẫu giống nhau.
LÝ LỊCH
Khách hàng có phương pháp khảo nghiệm mới mà họ muốn hiển thị là "tương đương" với phương pháp được phê duyệt hiện có. Cách tiếp cận của họ là so sánh kết quả của cả hai phương pháp được áp dụng cho cùng một mẫu. Ba trang web đã được sử dụng để làm thử nghiệm. Lỗi trong biến (hồi quy Deming) được áp dụng cho dữ liệu tại mỗi trang. Ý tưởng là nếu hồi quy cho thấy tham số độ dốc gần bằng 1 và chặn gần 0 thì điều này sẽ cho thấy hai kỹ thuật khảo nghiệm cho kết quả gần như nhau và do đó phương pháp mới phải được phê duyệt. Tại địa điểm 1, họ có 45 mẫu cho họ 45 quan sát được ghép nối. Trang web 2 có 40 mẫu và trang 3, 43 mẫu. Họ đã thực hiện ba hồi quy Deming riêng biệt (giả sử tỷ lệ 1 cho các lỗi đo lường cho hai phương pháp). Vì vậy, thuật toán tối thiểu hóa tổng khoảng cách vuông góc bình phương.
Trong bản đệ trình của họ, khách hàng đã chỉ ra rằng một số mẫu được sử dụng tại các trang 1 và 2 giống nhau. Trong đánh giá, nhà phê bình của FDA cho rằng hồi quy Deming không hợp lệ vì các mẫu phổ biến được sử dụng gây ra "nhiễu" làm mất hiệu lực các giả định của mô hình. Họ yêu cầu điều chỉnh bootstrap được áp dụng cho kết quả Deming để tính đến sự can thiệp này.
Vào thời điểm đó vì khách hàng không biết làm thế nào để khởi động tôi đã được đưa vào. Thuật ngữ can thiệp là lạ và tôi không chắc chính xác những gì người đánh giá đang nhận được. Tôi giả định rằng vấn đề thực sự là bởi vì dữ liệu gộp có các mẫu chung sẽ có mối tương quan cho các mẫu chung và do đó các thuật ngữ lỗi mô hình sẽ không hoàn toàn độc lập.
PHÂN TÍCH KHÁCH HÀNG
Ba hồi quy riêng biệt rất giống nhau. Mỗi có tham số độ dốc gần bằng 1 và chặn gần 0. Khoảng tin cậy 95% chứa 1 và 0 cho độ dốc và đánh chặn tương ứng trong mỗi trường hợp. Sự khác biệt chính là phương sai dư cao hơn một chút ở vị trí 3. Ngoài ra, họ đã so sánh kết quả này với kết quả từ việc thực hiện OLS và thấy chúng rất giống nhau (chỉ trong một trường hợp, khoảng tin cậy cho độ dốc dựa trên OLS không chứa 1). Trong trường hợp CI OLS cho độ dốc không chứa 1 thì giới hạn trên của khoảng là 0,99.
Với kết quả tương tự nhau ở cả ba trang web, dữ liệu trang web có vẻ hợp lý. Khách hàng đã thực hiện hồi quy Deming gộp cũng dẫn đến kết quả tương tự. Với những kết quả này, tôi đã viết một báo cáo cho khách hàng tranh luận về tuyên bố rằng các hồi quy là không hợp lệ. Lập luận của tôi là bởi vì có các lỗi đo lường tương tự trong cả hai biến, khách hàng có quyền sử dụng hồi quy Deming như một cách để thể hiện sự đồng ý / không đồng ý. Hồi quy trang web riêng lẻ không có vấn đề về lỗi tương quan vì không có mẫu nào được lặp lại trong một trang web nhất định. Tập hợp dữ liệu để có được khoảng tin cậy chặt chẽ hơn.
Khó khăn này có thể được khắc phục bằng cách đơn giản gộp dữ liệu với các mẫu phổ biến từ trang 1 nói ra. Ngoài ra ba mô hình trang web cá nhân không có vấn đề và là hợp lệ. Điều này dường như với tôi để cung cấp bằng chứng mạnh mẽ của thỏa thuận ngay cả khi không có sự góp mặt. Hơn nữa, các phép đo được thực hiện độc lập tại các trang 1 và 2 cho các trang phổ biến. Vì vậy, tôi nghĩ rằng ngay cả phân tích gộp sử dụng tất cả dữ liệu là hợp lệ vì các lỗi đo lường cho mẫu tại trang 1 không tương quan với các lỗi đo lường trong mẫu tương ứng tại trang 2. Điều này thực sự chỉ là lặp lại một điểm trong thiết kế không gian không phải là một vấn đề. Nó không tạo ra sự tương quan / "nhiễu".
Trong báo cáo của tôi, tôi đã viết rằng một phân tích bootstrap là không cần thiết bởi vì không có mối tương quan để điều chỉnh cho. Ba mô hình trang web là hợp lệ (không có "nhiễu" có thể có trong các trang web) và phân tích gộp có thể được thực hiện để loại bỏ các mẫu phổ biến tại trang 1 khi thực hiện gộp. Một phân tích gộp như vậy không thể có một vấn đề can thiệp. Điều chỉnh bootstrap sẽ không cần thiết vì không có sự điều chỉnh nào cho điều chỉnh.
PHẦN KẾT LUẬN
Khách hàng đồng ý với phân tích của tôi nhưng sợ đưa nó đến FDA. Họ muốn tôi thực hiện điều chỉnh bootstrap nào.
NHỮNG CÂU HỎI CỦA TÔI
A) Bạn có đồng ý với (1) Phân tích của tôi về kết quả của khách hàng và (2) lập luận của tôi rằng bootstrap là không cần thiết.
B) Cho rằng tôi phải bootstrap hồi quy Deming, có bất kỳ thủ tục nào SAS hoặc R có sẵn để tôi thực hiện hồi quy Deming trên các mẫu bootstrap không?
EDIT: Đưa ra gợi ý của Bill Huber, tôi dự định xem xét các giới hạn về hồi quy lỗi trong biến bằng hồi quy cả y trên x và x trên y. Chúng ta đã biết rằng đối với một phiên bản OLS, câu trả lời về cơ bản giống như các lỗi trong biến khi hai phương sai lỗi được giả sử là bằng nhau. Nếu điều này đúng với hồi quy khác thì tôi nghĩ điều đó sẽ cho thấy hồi quy Deming đưa ra một giải pháp thích hợp. Bạn có đồng ý không?
Để đáp ứng yêu cầu của khách hàng, tôi cần thực hiện phân tích bootstrap được yêu cầu được xác định một cách mơ hồ. Về mặt đạo đức tôi nghĩ sẽ là sai lầm khi chỉ cung cấp bootstrap vì nó không thực sự giải quyết được vấn đề thực sự của khách hàng, đó là biện minh cho quy trình đo thử nghiệm của họ. Vì vậy, tôi sẽ cung cấp cho họ cả hai phân tích và yêu cầu ít nhất là họ nói với FDA rằng ngoài việc thực hiện bootstrap, tôi đã thực hiện hồi quy ngược và giới hạn các hồi quy Deming mà tôi nghĩ là phù hợp hơn. Ngoài ra tôi nghĩ rằng phân tích sẽ chỉ ra rằng phương pháp của họ tương đương với tham chiếu và do đó hồi quy Deming cũng đầy đủ.
Tôi dự định sử dụng chương trình R mà @whuber gợi ý trong câu trả lời của anh ấy để cho phép tôi khởi động hồi quy Deming. Tôi không quen thuộc lắm với R nhưng tôi nghĩ tôi có thể làm được. Tôi đã cài đặt R cùng với R Studio. Điều đó sẽ làm cho nó đủ dễ dàng cho một người mới như tôi?
Ngoài ra tôi có SAS và tôi lập trình thoải mái hơn trong SAS. Vì vậy, nếu bất cứ ai biết một cách để làm điều này trong SAS, tôi sẽ đánh giá cao việc biết về nó.