Có cái tên nào hay hơn mức trung bình của các bộ phận tích hợp không?


12

Tôi đang thử nghiệm cảm biến vị trí bướm ga (TPS) doanh nghiệp của tôi bán và tôi in sơ đồ đáp ứng điện áp cho vòng quay của trục ga. TPS là một cảm biến quay với phạm vi 90 ° và đầu ra giống như một chiết áp với mức mở hoàn toàn là 5V (hoặc giá trị đầu vào của cảm biến) và mở ban đầu là một giá trị trong khoảng từ 0 đến 0,5V. Tôi đã xây dựng một băng ghế thử nghiệm với bộ điều khiển PIC32 để đo điện áp mỗi 0,75 ° và đường màu đen kết nối các phép đo này.

Một trong những sản phẩm của tôi có xu hướng biến các đường biên độ cục bộ, biên độ thấp ra khỏi (và dưới) đường lý tưởng. Câu hỏi này là về thuật toán của tôi để định lượng các "dấu chấm" cục bộ này; một tên hay mô tả tốt cho quá trình đo các chấm là gì? (giải thích đầy đủ sau) Trong hình dưới đây, sự nhúng xảy ra ở phần ba bên trái của cốt truyện và là trường hợp cận biên cho dù tôi sẽ vượt qua hay thất bại phần này:

In ra một phần nghi ngờ

Vì vậy, tôi đã xây dựng một máy dò nhúng ( stackoverflow qa về thuật toán ) để định lượng cảm giác ruột của tôi. Ban đầu tôi nghĩ mình đang đo "diện tích". Biểu đồ này dựa trên bản in ở trên và nỗ lực của tôi để giải thích thuật toán bằng đồ họa. Có một lần ngâm kéo dài cho 13 mẫu trong khoảng từ 17 đến 31:

Dữ liệu được lấy mẫu được hiển thị với độ phóng đại "nhúng"

deltasdeltas

deltasdydx

Phân tích đạo hàm ...?

deltasdeltas

0.7+1.2+1.3+1.4+1.8+2.5+2.9+3.0+2.5+2.0+1.5+1.0+1.2

23

Đường màu xanh lá cây là trung bình của các "giá trị dưới trung bình" này được tìm thấy thông qua việc chia diện tích cho độ dài của độ nhúng:

23÷13=1.77

2.63.0

|deltasavg|>avg+stddev

Đã gần 20 năm kể từ Calc 1, vì vậy xin hãy dễ dàng với tôi, nhưng điều này cảm thấy rất giống như khi một giáo sư sử dụng phép tính và phương trình chuyển vị để giải thích làm thế nào trong cuộc đua, một đối thủ có gia tốc ít hơn duy trì tốc độ góc cao hơn có thể đánh bại người khác đối thủ cạnh tranh có gia tốc lớn hơn cho lượt tiếp theo: đi qua lượt trước nhanh hơn, tốc độ ban đầu cao hơn có nghĩa là khu vực dưới vận tốc (chuyển vị) của anh ta lớn hơn.

Để dịch điều đó sang câu hỏi của tôi, tôi cảm thấy như dòng màu xanh lá cây của tôi sẽ giống như gia tốc, đạo hàm thứ 2 của dữ liệu gốc.

Tôi đã truy cập wikipedia để đọc lại các nguyên tắc cơ bản của tính toán và các định nghĩa về đạo hàm và tích phân , đã học thuật ngữ thích hợp để thêm diện tích dưới một đường cong thông qua các phép đo kín đáo là Tích hợp số . Trung bình tích lũy nhiều hơn trung bình của tích phân và tôi dẫn đến chủ đề xử lý tín hiệu số và phi tuyến. Tính trung bình tích phân dường như là một số liệu phổ biến để định lượng dữ liệu .

1.77


Tôi nghĩ "nhúng trung bình" là đủ tốt. Nó không có kích thước của gia tốc, vì vậy chắc chắn không có gì để làm với điều đó.
ShreevatsaR

Và tôi sẽ đánh giá cao bất kỳ quan sát hoặc bình luận về chủ đề này nói chung. Tôi hơi băn khoăn về cách đo "cảm giác ruột" này không được biểu thị tốt hơn về mặt toán học.
Chris K

Bạn có thể thêm vào tất cả các điểm dữ liệu mà bạn đã sử dụng để xây dựng đường lý tưởng hay thêm một chút thông tin về cách đường màu đỏ chấm được tính toán để chứng minh các thanh màu xanh là "vùng đồng bằng dưới mức trung bình của tất cả các điểm dữ liệu "? Nếu về mặt đạo đức là khoảng cách trung bình so với mức trung bình, thì nên có một tên kiểu tăng tốc cho nó, thay thế sự khác biệt tất nhiên bằng việc lấy trung bình.

1
Di chuyển từ Math.SE theo yêu cầu của OP: meta.stats.stackexchange.com/questions/1845/ dọa
Willie Wong

1
Tôi có thể thêm từ "cục bộ" để làm rõ rằng bước 1 tồn tại - Tôi đồng ý với @Glen_b (một Glen khác - hi!) Rằng điều này rất quan trọng. Vì vậy, tôi sẽ đề nghị "khiếm khuyết trung bình cục bộ" nơi tôi chỉ ghép "độ lệch từ lý tưởng" thành "khuyết tật". Có vẻ phù hợp.
Glen Wheeler

Câu trả lời:


3

Trước hết, đây là một mô tả tuyệt vời về dự án của bạn và về vấn đề. Và tôi là một fan hâm mộ lớn của khung đo lường tự làm tại nhà của bạn, nó rất tuyệt vời ... vậy tại sao trên trái đất lại có vấn đề gì khi bạn gọi là "tính trung bình các tích phân"?

x[n]>αSD(x[1:n1])=>x[n] is outlier
x[n]nthSD(x[1:n1])1st(n1)thαh
x[n]>αSD(x[nh1:n1])=>x[n] is outlier

x[n]

Ngoài ra còn có các quy tắc khác mà bạn có thể muốn xem xét cho mục đích phân loại thiết bị là bị lỗi:

  • nếu bất kỳ độ lệch (delta) nào lớn hơn một số bội số SD của tất cả các vùng đồng bằng
  • nếu tổng bình phương của độ lệch lớn hơn một ngưỡng nhất định
  • nếu tỷ lệ của tổng số đồng bằng âm và dương không xấp xỉ bằng nhau (có thể hữu ích nếu bạn thích các lỗi nhỏ hơn ở cả hai hướng thay vì sai lệch mạnh theo một hướng)

Tất nhiên bạn có thể tìm thấy nhiều quy tắc hơn và ghép chúng lại bằng logic boolean, nhưng tôi nghĩ bạn có thể đi rất xa với ba quy tắc trên.

Cuối cùng nhưng không kém phần quan trọng, một khi bạn thiết lập nó, bạn sẽ cần kiểm tra trình phân loại (bộ phân loại là hệ thống / mô hình ánh xạ đầu vào thành một lớp, trong trường hợp của bạn là dữ liệu của từng thiết bị, "tốt" hoặc "tốt" hoặc "tốt" bị lỗi "). Tạo một bộ kiểm tra bằng cách dán nhãn thủ công hiệu suất của từng thiết bị. Sau đó, nhìn vào ROC , về cơ bản sẽ cho bạn biết độ lệch giữa số lượng thiết bị mà hệ thống của bạn nhận được chính xác từ trả lại, liên quan đến số lượng thiết bị bị lỗi mà nó nhặt được.


Tôi tin rằng "tại sao nó lại quan trọng" là một chức năng của tên người dùng của riêng bạn. :) Tại sao? Cùng một lý do có một đỉnh iliac: chúng ta cần từ ngữ để định lượng rõ ràng mọi thứ độc nhất trong cuộc sống. Imho, QA này là một ví dụ về mức độ giới hạn của từ vựng trong số liệu thống kê. Chúng ta cần kết hợp các mô tả khó hiểu hoặc mâu thuẫn cho những gì "để mắt" đơn giản như vậy.
Chris K

Hehe, phát hiện tốt thưa ngài! :) Nếu tôi bỏ qua bất kỳ sự mạo hiểm nào vào vùng đất của thương hiệu sáng tạo thì đó chỉ là vì tôi cảm thấy bắt buộc phải hỗ trợ sự tháo vát và cống hiến cho nỗ lực và ý tưởng của bạn hơn là để tạo ra các nhãn hiệu vô ích. Vì bạn khăng khăng đặt tên cho giá trị trung bình của tích phân, hãy cẩn thận rằng những gì bạn cho là "giá trị trung bình của tích phân" là một ý nghĩa đơn giản của đồng bằng của bạn. Và như vậy, các ngoại lệ của bạn chỉ đơn giản là "sai lệch so với trung bình" hoặc có thể sai lệch so với trung bình địa phương. Tôi hoàn toàn không thấy lợi thế của việc suy nghĩ tích hợp, trừ khi bạn không có đủ điểm lấy mẫu.
có nghĩa là
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.