Làm thế nào để đại diện cho việc sử dụng kWh theo năm so với nhiệt độ trung bình?


9

Để cho vui, tôi muốn lập biểu đồ mức tiêu thụ điện hàng tháng của hộ gia đình hàng năm. Tuy nhiên, tôi muốn bao gồm một số tài liệu tham khảo về nhiệt độ hàng tháng để tôi có thể xác định xem nhà hoặc hành vi của mình có được cải thiện, trở nên tồi tệ hơn hay giữ ổn định liên quan đến việc sử dụng kWh.

Dữ liệu tôi đang làm việc với:

+----------+--------+-----------+----------------+----------+-----------+------------+
|  Month   | # Days | kWh Usage | Daily kWh Avg. | Avg. Low | Avg. High | Avg. Temp. |
+----------+--------+-----------+----------------+----------+-----------+------------+
| Mar 2015 |     32 |      1048 |             33 |       40 |        60 |         50 |
| Feb 2015 |     29 |      1156 |             40 |       32 |        54 |         43 |
| Jan 2015 |     33 |      1143 |             35 |       38 |        57 |         47 |
| Dec 2014 |     30 |       887 |             30 |       39 |        61 |         50 |
| Nov 2014 |     29 |       645 |             22 |       45 |        67 |         56 |
| Oct 2014 |     29 |       598 |             21 |       60 |        78 |         69 |
| Sep 2014 |     32 |       893 |             28 |       70 |        85 |         77 |
| Aug 2014 |     30 |       965 |             32 |       72 |        87 |         79 |
| Jul 2014 |     29 |       784 |             27 |       72 |        87 |         79 |
| Jun 2014 |     32 |      1018 |             32 |       69 |        87 |         78 |
| May 2014 |     30 |       702 |             23 |       63 |        82 |         72 |
| Apr 2014 |     33 |       722 |             22 |       50 |        71 |         60 |
| Mar 2014 |     29 |       830 |             29 |       41 |        62 |         52 |
| Feb 2014 |     28 |      1197 |             43 |       32 |        52 |         42 |
| Jan 2014 |     33 |      1100 |             33 |       38 |        59 |         49 |
| Dec 2013 |     30 |       856 |             29 |       40 |        63 |         51 |
| Nov 2013 |     33 |       686 |             21 |       48 |        70 |         59 |
| Oct 2013 |     30 |       527 |             18 |       61 |        77 |         69 |
| Sep 2013 |     30 |       817 |             27 |       69 |        86 |         77 |
| Aug 2013 |     28 |       991 |             35 |       72 |        86 |         79 |
| Jul 2013 |     31 |       993 |             32 |       73 |        86 |         79 |
| Jun 2013 |     30 |       847 |             28 |       66 |        83 |         74 |
| May 2013 |     29 |       605 |             21 |       59 |        76 |         67 |
| Apr 2013 |     34 |       791 |             23 |       47 |        66 |         57 |
+----------+--------+-----------+----------------+----------+-----------+------------+

Tôi đã bắt đầu với một biểu đồ cột dễ dàng so sánh các giá trị theo tháng:

Biểu đồ cột sử dụng hàng tháng

Tôi đã hình dung ra một vùng nền hoặc biểu đồ đường đẹp được ánh xạ tới trục dọc thứ cấp (phải) hiển thị phạm vi cao / thấp nhưng nhận ra rằng sẽ có vấn đề với các nhóm nhiều năm.

Nó sẽ dễ dàng với một năm duy nhất:

Sử dụng 2014 kWh với Nhiệt độ

Tôi tò mò muốn biết liệu có ai có thể đề xuất một cách kết hợp tất cả dữ liệu hàng năm vào một biểu đồ duy nhất với so sánh nhiệt độ không?

Có một số tỷ lệ tôi có thể sử dụng có thể liên quan hiệu quả việc sử dụng kWh với nhiệt độ trung bình ... hoặc một số kỹ thuật hiển thị khác mà tôi đang xem ... hoặc tôi bị mắc kẹt với một biểu đồ mỗi năm?

Câu trả lời:


18

Tôi muốn đề xuất rằng điều quan trọng là phát triển một mô hình thực tế, thực tế hữu ích về chi phí năng lượng. Điều đó sẽ hoạt động tốt hơn để phát hiện các thay đổi về chi phí so với bất kỳ trực quan hóa dữ liệu thô nào có thể thực hiện. Bằng cách so sánh giải pháp này với giải pháp được cung cấp trên SO , chúng tôi có một trường hợp nghiên cứu rất hay về sự khác biệt giữa việc khớp đường cong với dữ liệuthực hiện phân tích thống kê có ý nghĩa.

(Gợi ý này dựa trên việc phù hợp với một mô hình như vậy đối với việc sử dụng hộ gia đình của tôi một thập kỷ trước và áp dụng nó để theo dõi các thay đổi trong giai đoạn đó. Lưu ý rằng một khi mô hình phù hợp, nó có thể dễ dàng được tính toán trong bảng tính cho mục đích theo dõi thay đổi, vì vậy chúng ta không nên cảm thấy bị giới hạn bởi khả năng (trong) của phần mềm bảng tính.)

Đối với những dữ liệu này, một mô hình hợp lý như vậy tạo ra một bức tranh khác biệt đáng kể về chi phí năng lượng và mô hình sử dụng so với một mô hình thay thế đơn giản (một bình phương nhỏ nhất bình phương sử dụng hàng ngày so với nhiệt độ trung bình hàng tháng). Do đó, mô hình đơn giản hơn có thể được coi là một công cụ đáng tin cậy để hiểu, dự đoán hoặc so sánh các mô hình sử dụng năng lượng.


Phân tích

tt0αβ

αβ

γ

t0t0t1

γt0

Ls=L/6Avg. LowAvg. HighAvg. Temp

Cuối cùng, chúng ta phải chuẩn hóa dữ liệu theo thời gian đơn vị chung. Mặc dù điều đó đã có trong Daily kWh Avg.biến, nhưng nó thiếu độ chính xác, vì vậy, thay vào đó, hãy chia tổng số cho số ngày để lấy lại độ chính xác đã mất.

Yt

y(t)=γ+α(tt0)I(t<t0)+β(tt0)I(t>t0)+ε(t)

Iεα,β,γt0t0

x0x1t(x)x

Cost(x0,x1)=x0x1y(t)dt=x0x1(γ+α(t(x)t0)I(t(x)<t0)+β(t(x)t0)I(t(x)>t0)+ε(t(x)))t(x)dx.

ε(t)ε¯t(x)t¯s(t¯)

y¯(t¯)=γ+(βα)s(t¯)2ϕs(t¯t0)+(t¯t0)(β+(αβ)Φs(t0t¯))+ε¯(t¯).

Φss(t¯)ϕ


Mô hình phù hợp

α,β,γt0t0Rε¯σ

Đối với những dữ liệu này, các ước tính là

(α^,β^,γ^,t0^,σ^)=(1.489,1.371,10.2,63.4,1.80).

Điều này có nghĩa là:

  • 1.49

  • 1.37

  • 10.2

  • 63.4

  • 1.80

Khoảng tin cậy và các biểu thức định lượng không chắc chắn khác trong các ước tính này có thể đạt được theo cách tiêu chuẩn với máy móc khả năng tối đa.


Hình dung

Để minh họa mô hình này, hình dưới đây vẽ sơ đồ dữ liệu, mô hình cơ bản, mức độ phù hợp với mức trung bình hàng tháng và phù hợp với bình phương bậc hai đơn giản nhất.

Nhân vật

t0

Lưu ý mức độ phù hợp khởi hành từ mô hình cơ bản (tức thời), đặc biệt là ở nhiệt độ trung bình! Đây là hiệu ứng trung bình hàng tháng. (Hãy nghĩ về độ cao của các đường màu đỏ và màu xanh bị "nhòe" trên mỗi đoạn màu xám nằm ngang. Ở nhiệt độ cực cao, mọi thứ đều tập trung ở các đường, nhưng ở nhiệt độ trung bình, hai cạnh của chữ "V" được lấy trung bình cùng nhau, phản ánh nhu cầu để sưởi ấm vào một số thời điểm và làm mát vào những thời điểm khác trong tháng.)


So sánh mô hình

2.071.97

Tuy nhiên, sự phù hợp bậc hai là hoàn toàn vô dụng để tìm hiểu những gì đang xảy ra! Công thức của nó,

y¯(t¯)=219.956.241t¯+0.04879(t¯)2,

tiết lộ không có gì sử dụng trực tiếp. Nói một cách công bằng, chúng ta có thể phân tích nó một chút:

  1. t^0=6.241/(2×0.04879)=64.063.4219.956.241(63.4)+0.04879(63.4)2=20.4

  2. y¯(t¯)=6.241+2(0.04879)t¯906.241+2(0.04879)(90)=2.54

    32|6.241+2(0.04879)(32)|=3.12

    606850785010

Tóm lại, mặc dù có vẻ gần như tốt trong hình dung, nhưng phương trình bậc hai phù hợp với sai lầm lớn trong việc ước tính số lượng quan tâm cơ bản liên quan đến sử dụng năng lượng. Do đó, việc sử dụng nó để đánh giá các thay đổi trong cách sử dụng là có vấn đề và cần được khuyến khích.


Tính toán

RMã này thực hiện tất cả các tính toán và âm mưu. Nó có thể dễ dàng thích nghi với các bộ dữ liệu tương tự.

#
# Read and process the raw data.
#
x <- read.csv("F:/temp/energy.csv")
x$Daily <- x$Usage / x$Length
x <- x[order(x$Temp), ]
#pairs(x)
#
# Fit a quadratic curve.
#
fit.quadratic <- lm(Daily ~ Temp+I(Temp^2), data=x)
# par(mfrow=c(2,2))
# plot(fit.quadratic)
# par(mfrow=c(1,1))
#
# Fit a simple but realistic heating-cooling model with maximum likelihood.
#
response <- function(theta, x, s) {
  alpha <- theta[1]; beta <- theta[2]; gamma <- theta[3]; t.0 <- theta[4]
  x <- x - t.0
  gamma + (beta-alpha)*s^2*dnorm(x, 0, s) +  x*(beta + (alpha-beta)*pnorm(-x, 0, s))
}
log.L <- function(theta, y, x, s) {
  #   theta = (alpha, beta, gamma, t.0, sigma)
  #   x = time
  #   s = estimated SD
  #   y = response
  y.hat <- response(theta, x, s)
  sigma <- theta[5]
  sum((((y - y.hat) / sigma) ^2 + log(2 * pi * sigma^2))/2)
}
theta <- c(alpha=-1, beta=5/4, gamma=20, t.0=65, sigma=2) # Initial guess
x$Spread <- (x$Temp.high - x$Temp.low)/sqrt(6)            # Uniform estimate
fit <- nlm(log.L, theta, y=x$Daily, x=x$Temp, x$Spread)
names(fit$estimate) <- names(theta)
#$
# Set up for plotting.
#
i.pad <- 10
plot(range(x$Temp)+c(-i.pad,i.pad), c(0, max(x$Daily)+20), type="n", 
     xlab="Temp", ylab="Cost, kWh/day",
     main="Data, Model, and Fits")
#
# Plot the data.
#
l <- matrix(mapply(function(l,r,h) {c(l,h,r,h,NA,NA)}, 
                   x$Temp.low, x$Temp.high, x$Daily), 2)
lines(l[1,], l[2,], col="Gray")
points(x$Temp, x$Daily, type="p", pch=3)
#
# Draw the models.
#
x0 <- seq(min(x$Temp)-i.pad, max(x$Temp)+i.pad, length.out=401)
lines(x0, cbind(1, x0, x0^2) %*% coef(fit.quadratic), lwd=3, lty=3)
#curve(response(fit$estimate, x, 0), add=TRUE, lwd=2, lty=1)
t.0 <- fit$estimate["t.0"]
alpha <- fit$estimate["alpha"]
beta <- fit$estimate["beta"]
gamma <- fit$estimate["gamma"]
cool <- "#1020c0"; heat <- "#c02010"
lines(c(t.0, 0), gamma + c(0, -alpha*t.0), lwd=2, lty=1, col=cool)
lines(c(t.0, 100), gamma + c(0, beta*(100-t.0)), lwd=2, lty=1, col=heat)
#
# Display the fit.
#
pred <- response(fit$estimate, x$Temp, x$Spread)
points(x$Temp, pred, pch=16, cex=1, col=ifelse(x$Temp < t.0, cool, heat))
#lines(lowess(x$Temp, pred, f=1/4))
#
# Estimate the residual standard deviations.
#
residuals <- x$Daily - pred
sqrt(sum(residuals^2) / (length(residuals) - 4))
sqrt(sum(resid(fit.quadratic)^2) / (length(residuals) - 3))

4
Đây có thể là câu trả lời tốt nhất cho bất kỳ câu hỏi tràn ngăn xếp nào tôi đã đọc. Tôi đánh giá rất cao thời gian dành cho việc giải thích logic và lý luận đằng sau giải pháp.
Shawn

1
Vật lý có nhiều lông hơn thế này. Vai trò của thiết bị ngưng tụ và thiết bị bay hơi trong việc làm nóng so với làm mát. Điều này có nghĩa là chúng hoạt động như hai hệ thống khác nhau, không phải là một hệ thống liên tục. Ngày độ nóng, ngày độ làm mát và ngày hút ẩm là ba trình điều khiển chi phí riêng biệt và tùy thuộc vào vị trí địa lý (nghĩ ak, wi, ca, az, mo và fl) và năm có thể hoạt động không liên tục (cuối mùa nóng 't giống như bắt đầu làm mát). Số liệu thống kê về dữ liệu cho biết có 5 mùa chứ không phải 4. Có thể là mùa của riêng nó, ít nhất là trong vòng 5 năm qua.
EngrStudent

@EngrStudent Tất cả các điểm tốt và được đánh giá cao. Tôi sẽ duy trì rằng cách tiếp cận được trình bày ở đây, mặc dù được đơn giản hóa, cho thấy những gì cần thiết để đặt nền tảng để trêu chọc những hiệu ứng tinh vi hơn. Khi bạn xử lý các điều khoản lớn trong mô hình - và tôi nghĩ không ai sẽ phủ nhận rằng nhiệt độ phải là yếu tố chi phối chi phí - sau đó, nếu bạn đã thực hiện điều đó theo cách có ý nghĩa vật lý, bạn có thể xác định các thuật ngữ khác và thậm chí có thể ước tính tác dụng của chúng một cách chính xác. Nếu bạn không giải quyết các điều khoản lớn một cách chính xác, thì bạn không có hy vọng nào để mô tả các điều khoản khác.
whuber

Tôi thích nền tảng / phân tích tốt này, xin vui lòng nghe đây là tiếng vỗ tay, không chỉ trích. Quá trình gia nhiệt khác với làm mát, do đó, phương trình bậc hai không hai bên có thể xảy ra mâu thuẫn với điều đó. Các cuộn dây bay hơi là trong nhà trong khi làm mát và ngoài trời trong quá trình sưởi ấm. Trong bơm nhiệt cũng có chu kỳ rã đông và "sao lưu nhiệt". Ngoài ra, máy nén phải làm việc nhiều hơn để chống lại nhiệt độ ngoài trời khắc nghiệt hơn, vì vậy, không chỉ bạn di chuyển nhiều nhiệt hơn, bạn còn di chuyển nó lên một ngọn đồi cao hơn. Nó không tuyến tính. Độ ẩm là lớn, và có thể là 2/3 ngân sách năng lượng. Không khí xâm nhập.
EngrStudent

@EngrStudent Cảm ơn bạn một lần nữa - đó là tất cả những điểm thú vị. Tôi không biết rằng độ ẩm có thể chiếm một tỷ lệ lớn như vậy trong ngân sách. Đó là kiểu quan sát minh họa giá trị tiềm năng của việc ghép một lý thuyết tốt (hay "mô hình khái niệm" trong một số vòng tròn) với phân tích thống kê.
whuber

0

Tôi đã nhận được câu trả lời tại StackOverflow . Nếu bất cứ ai có thêm suy nghĩ, tôi vẫn rất quan tâm đến các giải pháp thay thế.

/programming/29777890/data-visualization-how-to-interesent-kwh-usage-by-year-against-aenses-temperatu


1
Các giải pháp về SO là không thể tin được. Định luật làm mát của Newton , là một xấp xỉ bậc một hợp lý hữu ích như một điểm khởi hành, cho thấy âm mưu sử dụng năng lượng so với nhiệt độ nên là sự kết hợp của hai đường (có lẽ có độ dốc khác nhau). Nhiệt độ trung bình che giấu sự dao động nhiệt độ hàng ngày (và thậm chí hàng giờ) sẽ làm mờ khu vực tại giao điểm của các đường đó (nơi không cần sưởi ấm hay làm mát). Một sự phù hợp bậc hai có thể là hợp lý ở đó, nhưng sự phù hợp không theo triệu chứng cần phải là tuyến tính .
whuber

Tôi biết trung bình độ mờ chính xác nhưng đó là dữ liệu tôi có. Do hiểu biết kém về thống kê, tôi không nắm bắt được cụm từ "nên là sự kết hợp của hai dòng ...""không có triệu chứng phù hợp cần phải tuyến tính" . Từ một POV mới làm quen, bài viết SO có vẻ trực quan vì nó phù hợp với kỳ vọng của tôi rằng mức tiêu thụ năng lượng tăng ở hai đầu đối diện của thang đo nhiệt độ trong khi ở mức thấp nhất trong phạm vi trung bình, nơi không cần sưởi ấm hay làm mát. Không phải là một phù hợp bậc hai sẽ được đối xứng? Tôi không tin việc sử dụng năng lượng là đối xứng vì chúng ta sử dụng nhiều năng lượng để sưởi ấm hơn là mát mẻ. Tôi đánh giá cao bất kỳ sửa chữa hoặc lời khuyên.
Shawn

Một sự phù hợp bậc hai, mặc dù đối xứng, là phi vật lý ở các thái cực, bởi vì nó nói rằng bạn sẽ trả nhiều tiền hơn cho việc sưởi ấm ở nhiệt độ thấp nhất, và nhiều hơn để làm mát ở nhiệt độ cao hơn, là hợp lý. Hơn nữa, tính đối xứng trong lô sẽ chỉ được mong đợi khi chi phí để làm mát ngôi nhà theo độ bằng với chi phí để làm nóng nó trên mỗi độ, giả sử hệ thống sưởi và làm mát có hiệu quả tương đương. Điều đó có thể hoặc không thể xảy ra - nhưng bạn không nên áp đặt sự đối xứng đó lên mô hình của mình.
whuber

Tôi đồng ý rằng nó khác nhau vì nó tốn nhiều hơn để làm mát hơn nhiệt độ mỗi độ. Tuy nhiên, vì vậy tôi hiểu nhận xét đầu tiên, bạn có gợi ý sự phù hợp bậc hai từ bài SO - mặc dù hợp lý - không thực sự chính xác và phù hợp tuyến tính là câu trả lời đúng về mặt kỹ thuật do định luật làm mát của Newton? Đó là sự không hợp lý của giải pháp SO mà tôi không hiểu.
Shawn

1
Tôi không thể hoàn toàn phù hợp với câu trả lời của mình cho câu hỏi cuối cùng trong không gian để bình luận, vì vậy tôi đã đăng nó dưới dạng câu trả lời. Tuy nhiên, tôi không thấy cách bạn suy luận rằng chi phí làm mát mỗi độ lớn hơn chi phí sưởi ấm mỗi độ. Dữ liệu của bạn dường như cho thấy điều ngược lại là đúng (mặc dù chi phí khá gần, như người ta mong đợi). Và xin lưu ý rằng một mô hình tuyến tính không ngụ ý phù hợp tuyến tính ! Có rất nhiều thứ đang diễn ra ở đây để khiến dữ liệu đi chệch hướng một cách có hệ thống khỏi mô hình cơ bản này.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.