Bạn nên nhìn vào phân phối lognatural .
Mọi người có thể sử dụng nhật ký vì họ nghĩ rằng nó nén quy mô hoặc thứ gì đó, nhưng nguyên tắc sử dụng nhật ký là bạn đang làm việc với dữ liệu có phân phối lognatural. Điều này sẽ có xu hướng là những thứ như tiền lương, giá nhà đất, vv, trong đó tất cả các giá trị là tích cực và hầu hết là tương đối khiêm tốn, nhưng một số rất lớn.
Nếu bạn có thể lấy nhật ký của dữ liệu và nó trở nên bình thường, thì bạn có thể tận dụng nhiều tính năng của phân phối bình thường, như trung bình được xác định rõ, độ lệch chuẩn (và do đó là z-points), đối xứng, v.v.
Tương tự, việc thêm các bản ghi cũng giống như phép nhân của các giá trị un-log'd. Điều đó có nghĩa là bạn đã biến một bản phân phối trong đó các lỗi là phụ gia thành một trong đó chúng được nhân lên (tức là dựa trên tỷ lệ phần trăm). Vì các kỹ thuật như hồi quy OLS yêu cầu phân phối lỗi bình thường, làm việc với các bản ghi sẽ mở rộng khả năng ứng dụng của chúng từ phụ gia sang quy trình nhân.