Tính độ dốc trung bình: Điều hòa trung bình hay số học Có nghĩa là gì?


11

Tôi phải tính độ dốc phần trăm tăng trung bình cho một tập dữ liệu lớn, phương pháp cơ bản được trình bày chi tiết ở đây. Tuy nhiên, tôi đã bắt đầu tự hỏi liệu trung bình hài có thể phù hợp hơn trung bình số học tiêu chuẩn hay không, vì về mặt kỹ thuật nó là một tốc độ thay đổi. Tôi chưa thấy điều này xuất hiện trong bất kỳ cuộc thảo luận nào khác về độ dốc trung bình trên các điểm, khu vực, đường thẳng, v.v ... Nó khá đơn giản để thực hiện.

chỉnh sửa: Mục đích của việc tính toán độ dốc trung bình trong trường hợp này là tạo ra một tham số (trong số nhiều) được sử dụng trong mô hình hóa các ngưỡng khởi tạo kênh. Tôi có một tập hợp các vị trí đầu kênh được thu thập trường mà tôi sẽ thu thập tích lũy dòng chảy, các tham số tăng trung bình khác nhau, v.v. và sẽ sử dụng nhiều hồi quy tuyến tính để cố gắng mô tả các ngưỡng tích lũy theo các tham số khác.


4
Nó phụ thuộc vào lý do tại sao bạn tính toán độ dốc trung bình. Mục đích gì? Số lượng vật lý bạn đang cố gắng để đo lường? Mặc dù nhiều dạng trung bình là hợp pháp, hãy cẩn thận với ý nghĩa điều hòa: nó gây ra vấn đề khi bất kỳ độ dốc nào bằng 0, điều này thường xảy ra.
whuber

Câu trả lời:


10

Độ dốc trung bình nghe có vẻ như một đại lượng tự nhiên nhưng nó là một điều kỳ lạ. Chẳng hạn, độ dốc trung bình của một đồng bằng nằm ngang bằng phẳng là bằng 0, nhưng khi bạn thêm một chút tiếng ồn ngẫu nhiên, trung bình bằng không vào một DEM của đồng bằng đó, độ dốc trung bình chỉ có thể tăng lên. Các hành vi kỳ lạ khác là sự phụ thuộc của độ dốc trung bình vào độ phân giải DEM, mà tôi đã ghi lại ở đây , và sự phụ thuộc của nó vào cách DEM được tạo ra. Ví dụ, một số DEM được tạo từ các bản đồ đường viền thực sự hơi bậc thang - với các bước nhảy đột ngột nhỏ trong đó các đường đồng mức nằm - nhưng mặt khác là các biểu diễn chính xác của bề mặt trên tổng thể. Những cú nhảy đột ngột đó, nếu được cho quá nhiều hoặc quá ít trọng lượng trong quá trình tính trung bình, có thể thay đổi độ dốc trung bình.

Tăng trọng số có liên quan bởi vì, trong thực tế, một trung bình hài (và các phương tiện khác) có trọng số khác nhau của các sườn dốc. Để hiểu điều này, hãy xem xét trung bình hài của hai số dương xy . Theo định nghĩa,

Harmonic mean(x,y) = 1 / ((1/x + 1/y)/2) = x (y/(x+y)) + y (x/(x+y)) = a x + b y

trong đó các trọng số là a = y / (x + y) và b = x / (x + y). (Những giá trị này xứng đáng được gọi là "trọng số" bởi vì chúng là số dương và tổng hợp với nhau. Đối với trung bình số học, các trọng số là a = 1/2 và b = 1/2). Rõ ràng, trọng lượng gắn liền với x , tương đương với y / (x + y), là lớn khi xnhỏ so với y . Do đó, điều hòa có nghĩa là quá trọng lượng các giá trị nhỏ hơn .

Nó có thể giúp mở rộng câu hỏi. Giá trị trung bình hài là một trong các họ trung bình được tham số hóa bởi giá trị thực p . Giống như giá trị trung bình hài hòa có được bằng cách lấy trung bình các nghịch đảo của xy (và sau đó lấy đối ứng trung bình của chúng), nói chung, chúng ta có thể lấy trung bình các lũy thừa của xy (và sau đó lấy công suất 1 / pth của kết quả ). Các trường hợp p = 1 và p = -1 lần lượt là các phương tiện số học và hài hòa. (Chúng ta có thể định nghĩa một giá trị trung bình cho p = 0 bằng cách lấy các giới hạn và do đó cũng có được giá trị trung bình hình học như một thành viên của gia đình này.) Như pgiảm từ 1, các giá trị nhỏ hơn ngày càng nặng hơn; và khi p tăng từ 1, các giá trị lớn hơn sẽ ngày càng nặng hơn. Theo sau đó, giá trị trung bình chỉ có thể tăng khi p tăng và phải giảm khi p giảm. (Điều này thể hiện rõ trong hình thứ hai bên dưới, trong đó cả ba dòng đều phẳng hoặc tăng dần từ trái sang phải.)

Nhìn một cách thực tế về vấn đề này, thay vào đó chúng ta có thể nghiên cứu hành vi của các phương tiện khác nhau và thêm kiến ​​thức này vào hộp công cụ phân tích của chúng ta: khi chúng ta mong đợi các sườn dốc đi vào mối quan hệ theo cách mà các sườn nhỏ hơn phải được cung cấp nhiều hơn một ảnh hưởng, chúng ta có thể chọn một giá trị trung bình với p nhỏ hơn 1; và ngược lại, chúng ta có thể tăng p trên 1 để nhấn mạnh các độ dốc lớn nhất. Để kết thúc này, chúng ta hãy xem xét các hình thức khác nhau của hồ sơ thoát nước trong vùng lân cận của một điểm.

Để chỉ ra những gì có thể xảy ra, tôi đã xem xét ba địa hình địa phương khác nhau về chất lượng : một là nơi tất cả các độ dốc đều bằng nhau (điều này tạo ra một tài liệu tham khảo tốt); khác là nơi địa phương chúng ta nằm ở dưới cùng của một cái bát: xung quanh chúng ta các sườn dốc bằng không, nhưng sau đó tăng dần và cuối cùng, xung quanh vành, trở nên lớn tùy ý. Nghịch đảo của tình huống này xảy ra khi các dốc gần đó ở mức vừa phải nhưng sau đó chệch khỏi chúng ta. Điều đó dường như bao gồm một loạt các hành vi thực tế.

Dưới đây là các ô giả 3D của ba loại hình thoát nước này:

Cốt truyện 3D

Ở đây tôi đã tính độ dốc trung bình của mỗi độ - với cùng mã màu - như là một hàm của p , cho phép phạm vi p từ -1 (trung bình hài hòa) đến 2.

Độ dốc có nghĩa là vs p

Tất nhiên dòng màu xanh là ngang: không có vấn đề gì giá trị p mất trên, giá trị trung bình của một liên tục dốc không thể bất cứ điều gì khác hơn là hằng số (mà đã được thiết lập để 1 để tham khảo). Độ dốc cao xung quanh vành xa của bát đỏ ảnh hưởng mạnh đến độ dốc trung bình khi p thay đổi: chú ý độ lớn của chúng khi p vượt quá 1. Vành ngang ở bề mặt thứ ba (vàng-xanh) gây ra trung bình hài (p = - 1) bằng không.

Đáng chú ý là vị trí tương đối của ba đường cong thay đổi tại p = 0 (trung bình hình học): với p lớn hơn 0, bát màu đỏ có độ dốc trung bình lớn hơn màu xanh lam, trong khi đối với p âm , bát màu đỏ có trung bình nhỏ hơn dốc hơn màu xanh. Do đó, sự lựa chọn p của bạn có thể thay đổi ngay cả thứ hạng tương đối của độ dốc trung bình.

Ảnh hưởng sâu sắc của trung bình hài (p = -1) đối với hình dạng màu vàng-xanh sẽ khiến chúng ta tạm dừng: nó cho thấy rằng khi có đủ độ dốc nhỏ trong hệ thống thoát nước, giá trị trung bình có thể nhỏ đến mức nó lấn át mọi ảnh hưởng của Tất cả các sườn khác.

Theo tinh thần phân tích dữ liệu khám phá, bạn có thể xem xét việc thay đổi p --perinois cho phép phạm vi từ 0 đến lớn hơn 1 để tránh các trọng số cực đoan - và tìm giá trị nào tạo ra mối quan hệ tốt nhất giữa độ dốc trung bình và biến số bạn đang mô hình hóa (chẳng hạn như ngưỡng khởi tạo kênh). "Tốt nhất" thường được hiểu theo nghĩa "phần dư tuyến tính nhất" hoặc "tạo phần dư [homoscedastic] không đổi" trong mô hình hồi quy.


Cảm ơn đã phân tích kỹ lưỡng! Tôi sẽ phải suy nghĩ lại về điều này một chút.
Jay Guarneri

1

Tôi đã thực hiện một cách tiếp cận theo kinh nghiệm để tìm ra một câu trả lời bổ sung cho câu trả lời lý thuyết xuất sắc của whuber. Tôi quyết định tính độ dốc theo độ và trung bình bằng cách sử dụng trung bình góc . Tiếp theo, tôi đã tính toán các phương tiện số học và hài hòa của độ dốc phần trăm mà tôi đã tạo ra một tập hợp các điểm mẫu nằm ngẫu nhiên trong khu vực nghiên cứu. Tôi yêu cầu 2000 điểm với khoảng cách tối thiểu 100m, mang lại 1326 điểm. Tôi đã lấy mẫu các giá trị của từng raster độ dốc trung bình tại mỗi điểm và chuyển đổi tỷ lệ phần trăm trung bình thành độ bằng cách sử dụng công thức Degrees = atan(percent/100). Giả định của tôi ở đây là giá trị trung bình góc sẽ tạo ra độ dốc trung bình "chính xác" tính theo độ và bất kỳ tỷ lệ phần trăm nào đến gần nó sẽ là thủ tục chính xác.

Tiếp theo, tôi đã so sánh tất cả các giá trị khác không bằng cách sử dụng phép thử Kruskal - Wallace (giả định rằng đối với hầu hết các giá trị độ dốc bằng 0, nó sẽ bằng 0 trong cả ba và giá trị 0 sẽ che giấu sự khác biệt giữa các phương thức). Tôi đã tìm thấy một sự khác biệt đáng kể giữa ba (chi-vuông = 17,9570, DF = 2, p = 0,0001), vì vậy tôi đã kiểm tra thêm dữ liệu bằng cách sử dụng Quy trình của Dunn bằng cách sử dụng alpha = 0,05 (Elliot và Hynan 2011) . Kết quả cuối cùng là trung bình số học và hài hòa khác nhau đáng kể với nhau, nhưng neigher khác biệt đáng kể so với trung bình góc:

Comparison           Diff        SE        q         q(0.05)    Conclude                      
------------------------------------------------------------------------------                
arith     harm      164.12    38.78     4.23       2.394    Reject                            
arith     angular   75.3      38.8      1.94       2.394    Do not reject                     
angular   harm      88.82     38.68     2.3        2.394    Do not reject                     

Nếu tất cả các giả định của tôi đều đúng (rất có thể không đúng), điều này có nghĩa là trong khi điều hòa và số học có nghĩa là tạo ra các giá trị khác nhau, thì cả hai đều "gần gũi" với nghĩa góc có thể chấp nhận được. Có hai sự cẩn thận khác ở đây mà tôi có thể nghĩ đến (vui lòng thêm bất kỳ người nào khác nếu bạn nghĩ về họ):

  1. Một cỡ mẫu lớn hơn có thể tìm thấy một sự khác biệt đáng kể giữa tỷ lệ phần trăm trung bình và trung bình góc. Tuy nhiên, cỡ mẫu của tôi là ~ 1000 điểm cho các giá trị khác không.
  2. Vì các điểm mẫu của tôi được đặt mà không liên quan đến các lưu vực thoát nước, có thể có một số sao chép giả liên quan, vì bất kỳ độ dốc trung bình nào sẽ liên quan đến độ dốc trung bình phía trên nó.

1
Điều này rất thú vị (+1), nhưng hãy cẩn thận với những hạn chế. (1) Có, nếu bạn chọn cỡ mẫu lớn hơn, bạn sẽ thấy rằng tất cả sự khác biệt là đáng kể. Do đó, không có ý nghĩa gì khi tiến hành kiểm tra giả thuyết thống kê: bạn muốn tập trung vào số lượng chênh lệch giữa các thủ tục. (2) Kết quả của bạn phụ thuộc hoàn toàn vào các thuộc tính thực tế của dữ liệu của bạn. Chúng sẽ thay đổi với các bộ dữ liệu khác. (3) Giá trị trung bình góc là hữu ích như một tài liệu tham khảo nhưng nó không có nghĩa là một giá trị ưa thích. Việc sử dụng làm tài liệu tham khảo phụ thuộc hoàn toàn vào cách sử dụng giá trị trung bình trong các phân tích hoặc ánh xạ tiếp theo.
whuber

0

Giả định rằng không có thông số xác định độ dốc nào được biết đến, bất kỳ nhà thống kê nào cũng sẽ nói sử dụng độ dốc để giảm thiểu độ lệch RMS của dữ liệu từ nó. (Tất nhiên, các ví dụ của người đăng ký không đủ điều kiện vì anh ta đã chọn các địa hình được tạo bằng toán học, nhưng đối với các địa hình thực, giả định không tham số được biết là hợp lệ.)


Câu trả lời này được đánh giá cao, nhưng tôi nghĩ rằng nó hiểu sai tình huống. Đáng kể nhất, các độ dốc này không được sử dụng để khớp với các đường cong: khái niệm "độ lệch RMS của dữ liệu" không được áp dụng. Thứ hai, tôi đã chọn các loại địa hình định tính để trải rộng trên phạm vi rộng của những gì sẽ thực sự gặp phải, vì vậy tôi duy trì họ cung cấp thông tin hữu ích về những gì mong đợi. Các bộ dữ liệu thực không đóng góp nhiều để hiểu những gì đang diễn ra ở đây, bởi vì không có thứ gọi là độ dốc trung bình "thực sự". Câu hỏi chính là những gì trung bình sẽ hữu ích hoặc thông tin.
whuber

1
BTW, tôi tin rằng tôi có một số bằng cấp như một nhà thống kê. Điều đó không làm cho ý kiến ​​của tôi về vấn đề này tốt hơn hay tồi tệ hơn: như với bất kỳ ai khác, tôi cần sao lưu nó một cách rõ ràng và khách quan nhất có thể, và tôi rất dễ bị sai và phải thay đổi suy nghĩ: - ). Tôi chỉ đưa ra quan điểm này như là một phản biện cho nhận xét "bất kỳ thống kê" nào của bạn.
whuber

Câu hỏi về sự phù hợp là hữu ích, tôi gửi, phụ thuộc vào độ dốc được sử dụng để làm gì. Ví dụ, đối với tiềm năng sụt đất, độ dốc cao hơn sẽ có trọng số cao hơn so với độ dốc nhẹ theo mô hình độ dốc so với mô hình độ dốc, thì phương pháp phù hợp RMS phải hợp lệ. Các mô hình trọng số khác sẽ được sử dụng phù hợp với việc sử dụng khác. Nói tóm lại, mô hình hóa mọi thứ chúng ta biết bằng cách cân hoặc các phương tiện khác, sau đó dựa vào RMS làm mô hình cho mọi thứ chúng ta không làm, là những gì tôi đề xuất.
johnsankey

Tôi đồng ý với tiền đề của nhận xét đó, John, nhưng tôi không thấy kết luận của bạn như thế nào. Nếu các sườn dốc hơn sẽ nhận được trọng lượng nặng hơn, thì có vẻ như RMS chỉ là những gì bạn không muốn làm, bởi vì nó cân bằng tất cả các độ lệch như nhau, bất kể độ dốc. Ngoài ra, RMS, như một hàm mất bậc hai, không thể là sự thay thế chung cho những gì các kỹ thuật khác có thể đạt được, bao gồm các biểu thức lại phi tuyến của độ dốc và sử dụng các hàm mất thay thế (ví dụ như được khai thác bằng các phương pháp phù hợp mạnh mẽ).
whuber

RMS bao gồm các trọng số
johnsankey 20/03/13
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.