Czym jest autokorelacja i do czego służy?

#Autokorelacja #EbiBlog #Pearson

W prognozowaniu zużycia energii elektrycznej najważniejszą informacją jest, czy szereg zużyć rzeczywistych zachowuje się powtarzalnie w kolejnych okresach. Czym są te szeregi? Dlaczego powinny wykazywać autokorelację? Zobacz w jaki sposób prowadzimy analizy szeregów w Ebicom!

Czym są szeregi dotyczące zużycia energii?

Szeregi czasowe to ciągi informacji, rejestrowane w regularnych odstępach czasu. Szeregi służą do opisywania zmian badanego zjawiska w określonych odcinkach czasu.

Ponieważ nas interesuje zużycie energii, szeregi czasowe, które analizujemy w Ebicom, dotyczą właśnie tych danych.

Czym te szeregi powinny się charakteryzować? Przede wszystkim powtarzalnością. Jest to o tyle istotne, że tylko regularne zachowanie szeregu pozwala przewidzieć jego zachowanie w przyszłości. Aby algorytmy mogły prawidłowo obliczać zużycie energii, kluczowe jest opisanie tej powtarzalności wartością liczbową. Jak to zrobić?

Czym jest współczynnik korelacji liniowej Pearsona?

Wzajemne powiązania i zależności pomiędzy zmiennymi zwane są korelacją.

Najczęściej wykorzystywaną miarą korelacji jest współczynnik korelacji liniowej Pearsona, opracowany przez angielskiego matematyka Karla Pearsona. Za pomocą tej korelacji możemy sprawdzić, czy pomiędzy dwoma zmiennymi następuje zależność liniowa.

Współczynniki korelacji Pearsona mogą wahać się  pomiędzy  -1, a 1: 

  • Wartości bliskie 1 oznaczają silną zależność dodatnią (jeżeli jedna zmienna rośnie, to druga również i odwrotnie).
  • Wartości bliskie -1 oznaczają silną zależność ujemną (jeżeli jedna zmienna rośnie, to druga zmienna maleje i odwrotnie).
  • Wartości bliskie 0 oznaczają brak korelacji.

Sytuację, gdy korelację badamy pomiędzy szeregiem czasowym, a tym samym szeregiem, ale przesuniętym o pewien okres, nazywamy autokorelacją.

Ponieważ w naszym przypadku zmienna jest tylko jedna – jest nią rzeczywiste zużycie energii – badamy autokorelację pomiędzy tą zmienną, a  nią samą przesuniętą w czasie.

Analiza szeregów zużycia – case study

Przeprowadziliśmy analizę szeregów zużycia w agregacjach miesięcznych. Na potrzeby tej analizy zbadaliśmy autokorelację szeregów z przesunięciem 12.

Do analizy wybraliśmy  3727 punktów poboru energii, ze zużyciem dla minimum 24 kolejnych miesięcy. Na poniższych wykresach ZR oznacza zużycie rzeczywiste, a ZG – obecne zużycie z grafiku (czyli prognozowane).

Poniżej przedstawiamy przykłady punktów poboru z wysoką wartością współczynnika korelacji.

Punkt 1
współczynnik korelacji Pearsona: 0.993

Punkt 2
współczynnik korelacji Pearsona: 0.994

Poniżej przedstawiamy przykłady punktów z wartością współczynnika korelacji bliską -1

Punkt 3
współczynnik korelacji Pearsona: -0.940

Punkt 4
współczynnik korelacji Pearsona: -0.879

Poniżej przedstawiamy przykłady punktów z wartością współczynnika korelacji bliską zeru

Punkt 5
współczynnik korelacji Pearsona: -0.001

Punkt 6
współczynnik korelacji Pearsona: 0.001

Poniższy histogram przedstawia rozkład uzyskanych wyników dla wszystkich analizowanych punktów poboru:

Mediana wyniosła 0.54. Oznacza to,  że dla większości punktów poboru uzyskany współczynnik świadczy o pożądanej powtarzalności szeregu.

Na przykładach wyraźnie widać, że punkty poboru z wysoką wartością współczynnika korelacji mają bardzo regularne wartości zużycia rzeczywistego, powtarzalne z roku na rok. Taki wynik  pozwoliłby uznać zużycie historyczne za istotny czynnik prognostyczny.

Zatem prognozowanie takich punktów w oparciu o dane historyczne zapewnia dużą dokładność
i wiarygodność prognozy.

Czytaj również

Czas czytania: 3 minuty

Czym jest system wykrywania anomalii w zużyciu prądu? 

#Anomalie #EbiBlog #ebicom #Prototyp #System
Joanna Lubowicka

Marketing Manager

Czas czytania: 4 minuty

Chatbot is coming – czyli co to jest chatbot i dlaczego stale zyskuje na popularności?

#Chatbot #Ebibot #ebicom
Joanna Lubowicka

Marketing Manager