Đưa ra một biểu đồ kiểm soát cho thấy giới hạn kiểm soát trung bình và trên / dưới, làm thế nào để tôi biết liệu nguyên nhân của các điểm kiểm soát có thể được gán hay không?


8

Bài kiểm tra thực hành của IEEE CSDA - Thống kê kỹ thuật - Biểu đồ kiểm soát

Tôi được 15 điểm. Các giới hạn kiểm soát nằm ở +/- 3 . Các điểm 1, 4, 5, 6, 7, 8, 9, 10, 11, 13 và 15 nằm trong giới hạn kiểm soát. Các điểm 2, 3, 12 và 14 nằm ngoài giới hạn kiểm soát, với 2 nằm dưới giới hạn kiểm soát thấp hơn và 3, 12 và 14 nằm trên giới hạn kiểm soát trên.σ

Làm thế nào để tôi biết nếu các điểm 2, 3, 12 và 14 nằm ngoài tầm kiểm soát do nguyên nhân cơ hội hoặc do nguyên nhân có thể gán được?


1
Nếu bất cứ ai muốn tôi, tôi có thể tạo ra một biểu đồ tương tự như biểu đồ tôi đã đưa ra và liên kết với nó ở đây. Câu hỏi này xuất phát từ một bài kiểm tra Liên kết Phát triển Phần mềm được Chứng nhận của IEEE - câu trả lời đúng rõ ràng là "ngoài tầm kiểm soát do các nguyên nhân có thể gán được". Thật không may, tôi không biết tại sao đó là câu trả lời - Tôi đã nói "ngoài tầm kiểm soát do nguyên nhân ngẫu nhiên" vì không có một loạt các điểm ngoài tầm kiểm soát.
Thomas Owens

Vâng, đồ thị sẽ hữu ích. Như đã nêu trong câu trả lời của tôi, giao diện của biểu đồ cũng rất quan trọng, không chỉ những điểm nằm ngoài giới hạn kiểm soát.
Carlos Accioly

Tôi chỉ cần thêm một hình ảnh của câu hỏi, biểu đồ bao gồm. Tôi đánh dấu câu trả lời đúng là tốt.
Thomas Owens

Câu trả lời:


6

Có, bạn nên tìm và gán nguyên nhân cho mọi điểm nằm ngoài giới hạn. Nhưng mọi thứ phức tạp hơn một chút.

Trước tiên, bạn phải xác định xem quy trình có trong tầm kiểm soát hay không, vì biểu đồ kiểm soát là vô nghĩa khi quy trình nằm ngoài tầm kiểm soát. Gần 1/4 quan sát của bạn nằm ngoài giới hạn là một dấu hiệu mạnh mẽ cho thấy quá trình có thể nằm ngoài tầm kiểm soát. Nhìn vào biểu đồ sẽ hữu ích để xác định xem quá trình có được kiểm soát hay không.

Bên cạnh việc vượt ra ngoài giới hạn kiểm soát, có những lý do tiềm năng khác cần phải tìm kiếm các nguyên nhân có thể gán cho các quan sát nhất định. Ví dụ: nếu bạn có một số quan sát liên tiếp rơi vào cùng một phía của giá trị trung bình - đặc biệt nếu chúng ở gần giới hạn kiểm soát - chúng có thể cần được chỉ định một nguyên nhân đặc biệt.

Tôi có thể có thể cụ thể hơn nếu bạn đăng biểu đồ đó.

Nếu bạn muốn tìm hiểu thêm về biểu đồ kiểm soát, SPC Press có một số tài nguyên miễn phí hữu ích. Bạn cũng có thể muốn xem cuốn sách này : nó ngắn gọn, súc tích và rất nhiều thông tin.

(Biên tập:)

Tôi giả sử chúng ta đang nói về dữ liệu trong thế giới thực, không phải là một câu hỏi thi. Trong trường hợp này, câu trả lời đúng thực sự là câu đầu tiên: các điểm nằm ngoài giới hạn kiểm soát là (có thể) do nguyên nhân có thể gán được.

Tuy nhiên, bài kiểm tra hơi cẩu thả trong thuật ngữ của nó: bạn thực sự không thể nói chắc chắn 100% rằng các điểm nằm ngoài giới hạn kiểm soát không phải do tình cờ. Bạn chỉ có thể nói rằng có xác suất 99,7% rằng một điểm cụ thể nằm ngoài giới hạn không phải do tình cờ.


Tôi đã thêm một hình ảnh bao gồm các câu hỏi và biểu đồ ban đầu.
Thomas Owens

5

Sự hiểu biết của tôi về biểu đồ kiểm soát hơi khác một chút ... Sau tín hiệu đầu tiên ở lần quan sát 2, quá trình sẽ không dừng lại và kiểm tra các vấn đề, sau đó khởi động lại?

Trong mọi trường hợp, bạn có thể sử dụng đối số giá trị p. Xác suất quan sát 4 hoặc nhiều hơn các quan sát (trong số 15) vượt quá giới hạn kiểm soát của chúng là RẤT nhỏ nếu quá trình thực sự nằm trong tầm kiểm soát. Giả sử xác suất quan sát vượt ra ngoài giới hạn kiểm soát trong khi quá trình thực sự nằm trong tầm kiểm soát là khoảng 0,01 (xác suất chính xác này phụ thuộc vào phân phối kiểm soát dữ liệu), vì vậy nếu quá trình này nằm trong tầm kiểm soát, chúng tôi dự đoán là sai báo động (tức là tín hiệu ngoài tầm kiểm soát gây ra bởi cơ hội ngẫu nhiên) cứ sau 100 lần quan sát. Xác suất quan sát 4 tín hiệu điều khiển trở lên (trong số 15) trong khi quá trình nằm trong tầm kiểm soát là khoảng 0,000012, do đó rất khó có khả năng các tín hiệu là do cơ hội ngẫu nhiên.

Mặc dù chẩn đoán thực tế sẽ yêu cầu bạn nhìn vào biểu đồ và có thể thực sự điều tra quá trình vật lý, bởi vì các điểm ngoài tầm kiểm soát đều ở dưới và trên giới hạn kiểm soát, tôi cá là có sự thay đổi quy mô (tức là tăng phương sai. )


Tôi mới chỉ học một khóa về Chỉ số Kỹ thuật, nhưng tôi dường như nhớ rằng bạn không dừng quá trình cho đến khi bạn có 3 (có thể 2) điểm ngoài tầm kiểm soát. Tuy nhiên, đối số thứ hai của bạn có ý nghĩa, trong đó một quá trình thực sự trong tầm kiểm soát sẽ không có 4/15 quan sát bên ngoài +/- 3 std dev. Thật không may, tôi không có cuốn sách EngStats của mình ở nhà để xác minh điều đó. Ít nhất là nó hợp lý. +1 bây giờ, cho đến khi tôi có thể nghiên cứu thêm điều này. Nhưng ít nhất đó là một điểm khởi đầu.
Thomas Owens

(+1) Câu trả lời hay. Ngoài ra, giả sử độ lệch chuẩn được ước tính trước đó từ một chuỗi dữ liệu rất dài, người ta có thể tự hỏi về tính quy tắc của phân phối. Hơn nữa, 15 điểm này không có khả năng là một lựa chọn ngẫu nhiên: chúng phải được chọn là một chuỗi ngắn trong đó xuất hiện một số lượng đo OOC bất thường. Cái trước cho thấy cơ hội của một OOC đơn lẻ có thể lớn hơn một chút so với 0,01 trong khi cái sau chỉ ra rằng phép tính nhị thức là sai lệch. Rốt cuộc, gần như chắc chắn rằng một chuỗi như vậy cuối cùng sẽ xảy ra tình cờ!
whuber

Tôi đã thêm một hình ảnh bao gồm các câu hỏi và biểu đồ ban đầu.
Thomas Owens

3
@Thomas Nó vẫn giống như một câu hỏi tồi đối với tôi. Nó cố gắng đo lường hai khái niệm (cách đọc biểu đồ kiểm soát và phân biệt giữa nguyên nhân "có thể gán" và "cơ hội"), đó là một sai lầm và nó trừng phạt người làm bài kiểm tra chu đáo, người biết rằng cần nhiều thông tin hơn để diễn giải các điểm OOC hơn được đưa ra ở đây, đó là sai lầm nghiêm trọng hơn.
whuber

4

(Xin lỗi vì đã đăng câu trả lời mới, tôi chưa thể trả lời nhận xét trực tiếp)

Tôi không thực sự đồng ý với tuyên bố:

"Rõ ràng, nếu bạn vượt qua UCL hoặc LCL, thì phải có một nguyên nhân có thể gán được"

Để đơn giản, nếu phân phối kiểm soát của bạn là N (0,1), thì bạn vẫn sẽ nhận được báo động sai một lần trong mỗi 370 lần quan sát, trung bình, sử dụng UCL là 3 và LCL là -3. Khi biểu đồ báo hiệu, quá trình cần phải được điều tra. Chỉ sau đó, một lý do cho tín hiệu được chỉ định (nghĩa là thay đổi quá trình hoặc lỗi ngẫu nhiên.) Đặt UCL và LCL yêu cầu người dùng cân bằng tỷ lệ phát hiện sai / báo động sai mong muốn (tương tự như đánh đổi lỗi Loại I / Loại II trong kiểm định giả thuyết.)

Bạn cũng có thể đợi cho đến khi một vài tín hiệu thực sự dừng lại và điều tra quá trình, nhưng trong trường hợp đó, bạn có thể phát hiện sự thay đổi quá muộn nếu nó thực sự xảy ra ở tín hiệu đầu tiên. Một lần nữa, bạn không thể có gì để làm và người dùng phải sử dụng phán đoán của họ để quyết định cách thiết lập biểu đồ kiểm soát và theo dõi quá trình.


2

Tôi đã tìm thấy một điều thú vị được giấu kín trong một tài liệu nghiên cứu từ IEEE hướng đến kỳ thi này:

  • Các điểm dữ liệu nằm trong phạm vi UCL và LCL được coi là trong tầm kiểm soát và gây ra bởi các nguyên nhân cơ hội.
  • Các ngoại lệ rơi trên UCL hoặc dưới LCL được coi là nằm ngoài tầm kiểm soát và gây ra bởi các nguyên nhân có thể gán.
  • Nếu một số điểm rơi xuống một cách có hệ thống trên hoặc dưới giá trị trung bình (nhưng nằm trong UCL và LCL) thì điều này có thể cho thấy trạng thái mất kiểm soát không đáng có.
  • Mục tiêu của biểu đồ kiểm soát là phát hiện nhanh các trạng thái mất kiểm soát.
  • Biểu đồ, một mình, sẽ không chỉ ra nguyên nhân gốc rễ của sự kiện, nhưng nó sẽ cung cấp các hướng dẫn điều tra.

Rõ ràng, nếu bạn vượt qua UCL hoặc LCL, thì phải có một nguyên nhân có thể gán được.

Điều này có ý nghĩa, dựa trên định nghĩa Wikipedia về các đặc điểm của nguyên nhân có thể gán (đặc biệt) :

  • Hiện tượng mới, không dự đoán được, xuất hiện hoặc bị bỏ quên trước đây trong hệ thống;
  • Sự biến đổi vốn không thể đoán trước, thậm chí là xác suất;
  • Sự thay đổi bên ngoài cơ sở kinh nghiệm lịch sử; và
  • Bằng chứng về một số thay đổi vốn có trong hệ thống hoặc kiến ​​thức của chúng tôi về nó.

OK, cảm ơn đã làm rõ: nó giải quyết câu hỏi ban đầu của bạn. "Có thể gán" dường như có nghĩa là "không quy cho cơ hội", phù hợp với sự phân đôi trong câu hỏi. Điều tôi đang vật lộn với giả định rằng các sự kiện OOC không thể là do tình cờ. Điều này rõ ràng là sai, như @HulkBeast đã lưu ý. Một khía cạnh nổi bật khác của tài liệu nghiên cứu là làm thế nào có vẻ không chính thức, không chất lượng và đặc biệt , như trong "một số điểm" (bao nhiêu?) Và "có hệ thống" (nghĩa là gì?). Nó dường như đề cập đến CUSUM hoặc chạy các biểu đồ mà không cung cấp các hướng dẫn phù hợp cho việc sử dụng chúng.
whuber

2
@whuber Mình đồng ý hoàn toàn. Xem xét điều này được công bố và duy trì bởi IEEE, tôi mong đợi tốt hơn rất nhiều. Tôi chỉ tự hỏi liệu họ có đang xử lý một loạt các công cụ bởi vì đó là chứng nhận công nghệ phần mềm và họ không muốn tìm hiểu quá nhiều về những thứ khác. Nhưng đó không phải là lý do cho một số nhầm lẫn này.
Thomas Owens
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.