Jakie są granice współczynnika korelacji? Test korelacji Pearsona. Doświadczenie zawodowe w latach

Różne znaki mogą być ze sobą powiązane.

Istnieją 2 rodzaje połączeń między nimi:

  • funkcjonalny;
  • korelacja.

Korelacja przetłumaczone na język rosyjski to nic innego jak połączenie.
W przypadku połączenia korelacyjnego można prześledzić zgodność kilku wartości jednej cechy z kilkoma wartościami innej cechy. Jako przykłady możemy rozważyć ustalone korelacje pomiędzy:

  • długość łap, szyj i dziobów ptaków, takich jak czaple, żurawie i bociany;
  • wskaźniki temperatury ciała i tętna.

W przypadku większości procesów biomedycznych obecność tego typu powiązania została udowodniona statystycznie.

Metody statystyczne pozwalają ustalić fakt istnienia współzależności cech. Zastosowanie w tym celu specjalnych obliczeń prowadzi do ustalenia współczynników korelacji (miar łączności).

Takie obliczenia nazywane są analiza korelacji. Przeprowadza się je w celu potwierdzenia zależności 2 zmiennych od siebie ( zmienne losowe), co wyraża się współczynnikiem korelacji.

Zastosowanie metody korelacji pozwala rozwiązać kilka problemów:

  • zidentyfikować istnienie związku pomiędzy analizowanymi parametrami;
  • wiedza o istnieniu korelacji pozwala na rozwiązywanie problemów prognostycznych. Zatem istnieje realna możliwość przewidzenia zachowania parametru na podstawie analizy zachowania innego korelującego parametru;
  • przeprowadzenie klasyfikacji w oparciu o wybór niezależnych od siebie cech.

Dla zmiennych:

  • w odniesieniu do skali porządkowej obliczany jest współczynnik Spearmana;
  • związany ze skalą interwałową – współczynnik Pearsona.

Są to najczęściej używane parametry, oprócz nich są jeszcze inne.

Wartość współczynnika można wyrazić dodatnio lub ujemnie.

W pierwszym przypadku wraz ze wzrostem wartości jednej zmiennej obserwuje się wzrost drugiej. Jeśli współczynnik jest ujemny, wzór jest odwrócony.

Do czego służy współczynnik korelacji?

Zmienne losowe powiązane ze sobą mogą mieć zupełnie inny charakter tego powiązania. Niekoniecznie będzie to funkcjonalne w przypadku, gdy można prześledzić bezpośredni związek między wielkościami. Najczęściej na obie wielkości wpływa cały zespół różnych czynników, a w przypadkach, gdy są one wspólne dla obu wielkości, obserwuje się powstawanie powiązanych wzorców.

Oznacza to, że statystycznie udowodniony fakt istnienia zależności pomiędzy wielkościami nie potwierdza ustalenia przyczyny zaobserwowanych zmian. Badacz z reguły dochodzi do wniosku, że istnieją dwie powiązane ze sobą konsekwencje.

Własności współczynnika korelacji

Ta cecha statystyczna ma następujące właściwości:

  • wartość współczynnika waha się od -1 do +1. Im bliżej wartości ekstremalnych, tym silniejsza jest dodatnia lub ujemna zależność pomiędzy parametrami liniowymi. W przypadku wartości zerowej mówimy o braku korelacji pomiędzy cechami;
  • dodatnia wartość współczynnika oznacza, że ​​jeśli wartość jednej cechy wzrasta, obserwuje się wzrost drugiej (korelacja dodatnia);
  • wartość ujemna – w przypadku wzrostu wartości jednej cechy obserwuje się spadek drugiej (korelacja ujemna);
  • zbliżając się do wartości wskaźnika skrajne punkty(albo -1, albo +1) wskazuje na obecność bardzo silnej zależności liniowej;
  • wskaźniki cechy mogą się zmieniać, a wartość współczynnika pozostaje niezmieniona;
  • współczynnik korelacji jest wielkością bezwymiarową;
  • obecność korelacji niekoniecznie potwierdza związek przyczynowo-skutkowy.

Wartości współczynników korelacji

Siłę korelacji można scharakteryzować, odwołując się do skali Cheldocka, w której danej wartości liczbowej odpowiada cecha jakościowa.

W przypadku dodatniej korelacji z wartością:

  • 0-0,3 – korelacja jest bardzo słaba;
  • 0,3-0,5 – słaby;
  • 0,5-0,7 – średnia wytrzymałość;
  • 0,7-0,9 – wysoki;
  • 0,9-1 – bardzo wysoka wytrzymałość korelacje.

Skalę można również zastosować do korelacji ujemnej. W tym przypadku cechy jakościowe są zastępowane przez przeciwieństwo.

Można skorzystać z uproszczonej skali Cheldocka, która wyróżnia tylko 3 stopnie siły korelacji:

  • bardzo silny - wskaźniki ±0,7 - ±1;
  • średnia - wskaźniki ±0,3 - ±0,699;
  • bardzo słaby - wskaźniki 0 - ±0,299.

Ten wskaźnik statystyczny pozwala nie tylko sprawdzić założenie o istnieniu liniowej zależności pomiędzy cechami, ale także określić jej siłę.

Rodzaje współczynników korelacji

Współczynniki korelacji można klasyfikować według znaku i wartości:

  • pozytywny;
  • zero;
  • negatywny.

W zależności od analizowanych wartości obliczany jest współczynnik:

  • Osoba;
  • Włócznik;
  • Kendala;
  • znaki Fechnera;
  • zgodność lub korelacja wielostopniowa.

Współczynnik korelacji Pearsona służy do ustalenia bezpośrednich zależności pomiędzy wartościami bezwzględnymi zmiennych. W takim przypadku rozkłady obu szeregów zmiennych powinny zbliżać się do normalnego. Porównywane zmienne muszą być różne ten sam numer różne znaki. Skala reprezentująca zmienne musi być skalą przedziałową lub ilorazową.

  • dokładne ustalenie siły korelacji;
  • porównanie cech ilościowych.

Stosowanie liniowego współczynnika korelacji Pearsona ma kilka wad:

  • metoda jest niestabilna w przypadku wartości odstających;
  • Metodą tą można określić siłę korelacji jedynie dla zależności liniowej, w przypadku pozostałych typów wzajemnych zależności zmiennych należy zastosować metody analizy regresji.

Korelację rang wyznacza się metodą Spearmana, która pozwala na statystyczne badanie zależności pomiędzy zjawiskami. Dzięki temu współczynnikowi jest on faktycznie obliczany istniejący stopień Ocenia się także równoległość dwóch wyrażonych ilościowo szeregów cech oraz bliskość zidentyfikowanego powiązania.

  • niewymagający dokładnego określenia wartości siły korelacji;
  • porównywane wskaźniki mają znaczenie zarówno ilościowe, jak i atrybutywne;
  • porównanie szeregów cech z otwartymi wariantami wartości.

Metoda Spearmana jest metodą analizy nieparametrycznej, zatem nie ma potrzeby sprawdzania normalności rozkładu cechy. Dodatkowo umożliwia porównanie wskaźników wyrażonych w różnych skalach. Np. porównanie liczby czerwonych krwinek w określonej objętości krwi (skala ciągła) i ocena ekspercka wyrażona w punktach (skala porządkowa).

Na skuteczność metody negatywnie wpływa duża różnica pomiędzy wartościami porównywanych wielkości. Metoda nie jest skuteczna również w przypadkach, gdy wartość mierzona charakteryzuje się nierównym rozkładem wartości.

Obliczanie krok po kroku współczynnika korelacji w programie Excel

Obliczenie współczynnika korelacji polega na sekwencyjnym wykonaniu szeregu operacji matematycznych.

Powyższy wzór na obliczenie współczynnika Pearsona pokazuje, jak pracochłonny jest ten proces, jeśli jest wykonywany ręcznie.
Wykorzystanie możliwości programu Excel znacznie przyspiesza proces znajdowania współczynnika.

Wystarczy postępować zgodnie z prostym algorytmem działań:

  • wprowadzenie podstawowych informacji - kolumna wartości x i kolumna wartości y;
  • w narzędziach wybierz i otwórz zakładkę „Formuły”;
  • w zakładce, która się otworzy, wybierz „Wstaw funkcję fx”;
  • w otwartym oknie dialogowym wybierz funkcję statystyczną „Corel”, która pozwala obliczyć współczynnik korelacji pomiędzy 2 zbiorami danych;
  • w oknie, które się otworzy, wprowadź dane: tablica 1 – zakres wartości kolumny x (dane muszą zostać wybrane), tablica 2 – zakres wartości kolumny y;
  • po naciśnięciu klawisza „ok” w wierszu „wartość” pojawi się wynik obliczenia współczynnika;
  • wniosek dotyczący obecności korelacji pomiędzy 2 zbiorami danych i jej siły.
Cel analizy korelacji polega na określeniu oszacowania siły powiązania pomiędzy zmiennymi losowymi (cechami), które charakteryzują jakiś proces rzeczywisty.
Problemy analizy korelacji:
a) Pomiar stopnia spójności (bliskość, siła, dotkliwość, intensywność) dwóch lub więcej zjawisk.
b) Wybór czynników mających największy wpływ na uzyskaną cechę, w oparciu o pomiar stopnia powiązania pomiędzy zjawiskami. Czynniki istotne w tym aspekcie wykorzystywane są dalej w analizie regresji.
c) Wykrywanie nieznanych związków przyczynowych.

Formy manifestacji relacji są bardzo różnorodne. Najpopularniejsze typy to funkcjonalne (kompletne) i połączenie korelacyjne (niekompletne)..
Korelacja pojawia się średnio w przypadku obserwacji masowych, kiedy dane wartości zmienna zależna odpowiada pewnej serii probabilistycznych wartości zmiennej niezależnej. Zależność nazywa się korelacją, jeśli każda wartość cechy czynnikowej odpowiada dobrze określonej, nielosowej wartości cechy wynikowej.
Wizualną reprezentacją tabeli korelacji jest pole korelacji. Jest to wykres, na którym wartości X są wykreślone na osi odciętych, wartości Y na osi rzędnych, a kombinacje X i Y są pokazane kropkami. Po położeniu kropek można ocenić obecność połączenia.
Wskaźniki bliskości połączenia pozwalają scharakteryzować zależność zmienności cechy wynikowej od zmienności cechy czynnikowej.
Bardziej zaawansowany wskaźnik stopnia zatłoczenia połączenie korelacyjne Jest współczynnik korelacji liniowej. Przy obliczaniu tego wskaźnika uwzględnia się nie tylko odchylenia poszczególnych wartości cechy od średniej, ale także samą wielkość tych odchyleń.

Kluczowymi pytaniami w tym temacie są równania regresji między wynikową charakterystyką a zmienną objaśniającą, czyli metodą najmniejszych kwadratów oszacować parametry modelu regresji, przeanalizować jakość otrzymanego równania regresji, skonstruować przedziały ufności do przewidywania wartości wynikowej charakterystyki za pomocą równania regresji.

Przykład 2


Układ równań normalnych.
za n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
Dla naszych danych układ równań ma postać
30a + 5763 b = 21460
5763 a + 1200261 b = 3800360
Z pierwszego równania wyrażamy A i podstawiamy do drugiego równania:
Otrzymujemy b = -3,46, a = 1379,33
Równanie regresji:
y = -3,46 x + 1379,33

2. Obliczanie parametrów równania regresji.
Przykładowe środki.



Przykładowe odchylenia:


Odchylenie standardowe


1.1. Współczynnik korelacji
Kowariancja.

Obliczamy wskaźnik bliskości połączenia. Wskaźnikiem tym jest przykładowy współczynnik korelacji liniowej, który oblicza się ze wzoru:

Współczynnik korelacji liniowej przyjmuje wartości od –1 do +1.
Powiązania między cechami mogą być słabe i mocne (bliskie). Ich kryteria oceniane są w skali Chaddocka:
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
W naszym przykładzie związek między cechą Y a czynnikiem X jest wysoki i odwrotny.
Dodatkowo współczynnik korelacji par liniowych można wyznaczyć poprzez współczynnik regresji b:

1.2. Równanie regresji(oszacowanie równania regresji).

Równanie regresji liniowej to y = -3,46 x + 1379,33

Współczynnik b = -3,46 pokazuje średnią zmianę efektywnego wskaźnika (w jednostkach miary y) wraz ze wzrostem lub spadkiem wartości współczynnika x na jednostkę jego miary. W w tym przykładzie przy wzroście o 1 jednostkę y zmniejsza się średnio o -3,46.
Współczynnik a = 1379,33 formalnie pokazuje przewidywany poziom y, ale tylko wtedy, gdy x = 0 jest bliskie wartościom z próby.
Ale jeśli x=0 jest dalekie od przykładowych wartości x, wówczas dosłowna interpretacja może prowadzić do błędnych wyników i nawet jeśli linia regresji opisuje dość dokładnie obserwowane wartości próbek, nie ma gwarancji, że to również ma to miejsce w przypadku ekstrapolacji w lewo lub w prawo.
Podstawiając odpowiednie wartości x do równania regresji, możemy wyznaczyć wyrównane (przewidywane) wartości wskaźnika wydajności y(x) dla każdej obserwacji.
Zależność pomiędzy y i x wyznacza znak współczynnika regresji b (jeśli > 0 – zależność bezpośrednia, w przeciwnym wypadku – odwrotność). W naszym przykładzie połączenie jest odwrotne.
1.3. Współczynnik elastyczności.
Nie zaleca się stosowania współczynników regresji (w przykładzie b) do bezpośredniej oceny wpływu czynników na charakterystykę wypadkową, jeżeli występuje różnica w jednostkach miary wskaźnika wypadkowego y i charakterystyki czynnikowej x.
W tym celu obliczane są współczynniki elastyczności i współczynniki beta.
Średni współczynnik elastyczności E pokazuje, o jaki procent średnio zmieni się wynik w agregacie Na od wartości średniej w przypadku zmiany współczynnika X o 1% swojej średniej wartości.
Współczynnik elastyczności oblicza się ze wzoru:


Współczynnik elastyczności jest mniejszy niż 1. Zatem jeśli X zmieni się o 1%, Y zmieni się o mniej niż 1%. Innymi słowy, wpływ X na Y nie jest znaczący.
Współczynnik beta pokazuje, o jaką część wartości jej odchylenia standardowego zmieni się wartość średnia wynikowej charakterystyki, gdy charakterystyka czynnikowa zmieni się o wartość jej odchylenia standardowego przy wartości pozostałych zmiennych niezależnych ustalonych na stałym poziomie:

Te. zwiększenie x o odchylenie standardowe S x spowoduje zmniejszenie średniej wartości Y o 0,74 odchylenia standardowego S y .
1.4. Błąd przybliżenia.
Oceńmy jakość równania regresji wykorzystując błąd przybliżenia bezwzględnego. Średni błąd aproksymacji - średnie odchylenie obliczonych wartości od rzeczywistych:


Ponieważ błąd jest mniejszy niż 15%, równanie to można zastosować jako regresję.
Analiza wariancji.
Celem analizy wariancji jest analiza wariancji zmiennej zależnej:
∑(y i - y cp) 2 = ∑(y(x) - y cp) 2 + ∑(y - y(x)) 2
Gdzie
∑(y i - y cp) 2 - całkowita suma kwadratów odchyleń;
∑(y(x) - y cp) 2 - suma kwadratów odchyleń wynikających z regresji („wyjaśniona” lub „silnia”);
∑(y - y(x)) 2 - suma resztowa kwadratów odchyleń.
Teoretyczna zależność korelacyjna dla połączenia liniowego jest równy współczynnikowi korelacji r xy .
Dla dowolnej formy zależności szczelność połączenia określa się za pomocą współczynnik korelacji wielokrotnej:

Współczynnik ten ma charakter uniwersalny, gdyż odzwierciedla bliskość zależności i dokładność modelu, a także może być stosowany do dowolnej formy powiązania pomiędzy zmiennymi. Przy konstruowaniu jednoczynnikowego modelu korelacji współczynnik korelacji wielokrotnej jest równy współczynnikowi korelacji par r xy.
1.6. Współczynnik determinacji.
Kwadrat współczynnika (wielokrotnej) korelacji nazywany jest współczynnikiem determinacji, który pokazuje proporcję zmienności wynikowego atrybutu wyjaśnioną zmianą atrybutu czynnika.
Najczęściej przy interpretacji współczynnika determinacji wyraża się go w procentach.
R2 = -0,742 = 0,5413
te. w 54,13% przypadków zmiany x prowadzą do zmian w y. Innymi słowy, dokładność wyboru równania regresji jest średnia. Pozostałe 45,87% zmiany Y wyjaśnia się czynnikami nieuwzględnionymi w modelu.

Bibliografia

  1. Ekonometria: Podręcznik / wyd. I.I. Eliseewa. – M.: Finanse i Statystyka, 2001, s. 25. 34..89.
  2. Magnus Y.R., Katyshev P.K., Peresetsky A.A. Ekonometria. Kurs dla początkujących. Instruktaż. – wyd. 2, wyd. – M.: Delo, 1998, s. 10-10. 17..42.
  3. Warsztaty z ekonometrii: Proc. zasiłek / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko i inni; wyd. I.I. Eliseewa. – M.: Finanse i Statystyka, 2001, s. 25. 5..48.

Współczynnik korelacji (lub współczynnik korelacji liniowej) jest oznaczany jako „r” (w rzadkich przypadkach jako „ρ”) i charakteryzuje korelację liniową (to znaczy relację określoną przez pewną wartość i kierunek) dwóch lub więcej zmiennych. Wartość współczynnika mieści się w przedziale od -1 do +1, co oznacza, że ​​korelacja może być zarówno dodatnia, jak i ujemna. Jeśli współczynnik korelacji wynosi -1, mamy do czynienia z doskonałą korelacją ujemną; jeśli współczynnik korelacji wynosi +1, istnieje doskonała korelacja dodatnia. W innych przypadkach istnieje korelacja dodatnia, korelacja ujemna lub brak korelacji między dwiema zmiennymi. Współczynnik korelacji można obliczyć ręcznie, korzystając z bezpłatnych kalkulatorów dostępnych online lub przy użyciu dobrego kalkulatora graficznego.

Kroki

Ręczne obliczanie współczynnika korelacji

    Zbieraj dane. Zanim zaczniesz obliczać współczynnik korelacji, przestudiuj podaną parę liczb. Lepiej zapisać je w tabeli, którą można ustawić pionowo lub poziomo. Oznacz każdy wiersz lub kolumnę jako „x” i „y”.

    • Na przykład podane są cztery pary wartości (liczb) zmiennych „x” i „y”. Możesz utworzyć następującą tabelę:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. Oblicz średnią arytmetyczną „x”. Aby to zrobić, dodaj wszystkie wartości „x”, a następnie podziel wynikowy wynik przez liczbę wartości.

    Znajdź średnią arytmetyczną „y”. Aby to zrobić, wykonaj podobne kroki, czyli zsumuj wszystkie wartości „y”, a następnie podziel sumę przez liczbę wartości.

    Oblicz odchylenie standardowe „x”. Po obliczeniu średnich x i y znajdź odchylenia standardowe tych zmiennych. Odchylenie standardowe oblicza się za pomocą następującego wzoru:

    Oblicz odchylenie standardowe „y”. Wykonaj kroki opisane w poprzednim kroku. Użyj tej samej formuły, ale zamień w niej wartości „y”.

    Zapisz podstawowy wzór na obliczenie współczynnika korelacji. Wzór ten obejmuje średnie, odchylenia standardowe i liczbę (n) par liczb dla obu zmiennych. Współczynnik korelacji oznacza się jako „r” (w rzadkich przypadkach jako „ρ”). W artykule wykorzystano wzór do obliczenia współczynnika korelacji Pearsona.

    Obliczyłeś średnie i odchylenia standardowe obu zmiennych, więc możesz skorzystać ze wzoru do obliczenia współczynnika korelacji. Przypomnijmy, że „n” to liczba par wartości obu zmiennych. Wartości pozostałych wielkości zostały obliczone wcześniej.

    • W naszym przykładzie obliczenia zostaną zapisane w następujący sposób:
    • ρ = (1 n - 1) Σ (x - μ x σ x) ∗ (y - μ y σ y) (\ Displaystyle \ rho = \ lewo ({\ Frac (1) (n-1)) \ prawo) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y))(\sigma _(y)))\prawo))
    • ρ = (1 3) ∗ (\ Displaystyle \ rho = \ lewo ({\ Frac (1) (3)) \ prawo) *)[ (1 - 3 1, 83) ∗ (1 - 4 2, 58) + (2 - 3 1, 83) ∗ (3 - 4 2, 58) (\ Displaystyle \ lewo ({\ Frac (1-3) ( 1,83))\right)*\left((\frac (1-4)(2,58))\right)+\left((\frac (2-3)(1,83))\right) *\left((\ frac (3-4)(2,58))\prawo))
      + (4 - 3 1 , 83) ∗ (5 - 4 2 , 58) + (5 - 3 1 , 83) ∗ (7 - 4 2 , 58) (\ Displaystyle + \ lewo ({\ Frac (4-3 )(1,83))\prawo)*\lewo((\frac (5-4)(2,58))\prawo)+\lewo((\frac (5-3)(1,83))\ prawo)*\lewo( (\frac (7-4)(2,58))\prawo))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\ Displaystyle \ rho = \ lewo ({\ Frac (1) (3)) \ prawo) * \ lewo ({\ Frac (6 +1+1+6)(4721))\po prawej))
    • ρ = (1 3) ∗ 2, 965 (\ Displaystyle \ rho = \ lewo ({\ Frac (1) (3)) \ prawo) * 2,965)
    • ρ = (2, 965 3) (\ Displaystyle \ rho = \ lewo ({\ Frac (2,965) (3)) \ prawo)}
    • ρ = 0,988 (\ displaystyle \ rho = 0,988)
  2. Przeanalizuj wynik. W naszym przykładzie współczynnik korelacji wynosi 0,988. Wartość ta w jakiś sposób charakteryzuje ten zbiór par liczb. Zwróć uwagę na znak i wielkość wartości.

    • Ponieważ wartość współczynnika korelacji jest dodatnia, pomiędzy zmiennymi „x” i „y” występuje dodatnia korelacja. Oznacza to, że wraz ze wzrostem wartości „x” wzrasta również wartość „y”.
    • Ponieważ wartość współczynnika korelacji jest bardzo bliska +1, wartości zmiennych „x” i „y” są ze sobą silnie powiązane. Jeśli narysujesz punkty na płaszczyźnie współrzędnych, będą one zlokalizowane blisko określonej linii prostej.

    Korzystanie z kalkulatorów internetowych do obliczenia współczynnika korelacji

    1. Znajdź kalkulator w Internecie, aby obliczyć współczynnik korelacji. Współczynnik ten jest dość często obliczany w statystykach. Jeśli istnieje wiele par liczb, ręczne obliczenie współczynnika korelacji jest prawie niemożliwe. Dlatego istnieją kalkulatory online do obliczania współczynnika korelacji. W wyszukiwarce wpisz „kalkulator współczynnika korelacji” (bez cudzysłowu).

      Wprowadzanie danych. Prosimy o zapoznanie się z instrukcjami na stronie internetowej, aby upewnić się, że wprowadzone dane (pary liczb) są prawidłowe. Niezwykle ważne jest wprowadzenie odpowiednich par liczb; w przeciwnym razie otrzymasz nieprawidłowy wynik. Pamiętaj, że różne strony internetowe mają różne formaty wprowadzania danych.

      • Przykładowo na stronie http://ncalculators.com/statistics/correlation-cooperative-calculator.htm wartości zmiennych „x” i „y” wpisuje się w dwóch poziomych liniach. Wartości oddziela się przecinkami. Oznacza to, że w naszym przykładzie wartości „x” wprowadza się w następujący sposób: 1,2,4,5, a wartości „y” w następujący sposób: 1,3,5,7.
      • Na innej stronie, http://www.alcula.com/calculators/statistics/correlation-cooperative/, dane wprowadzane są pionowo; w takim przypadku nie należy mylić odpowiednich par liczb.
    2. Oblicz współczynnik korelacji. Po wprowadzeniu danych wystarczy kliknąć przycisk „Oblicz”, „Oblicz” lub podobny, aby otrzymać wynik.

    Korzystanie z kalkulatora graficznego

    1. Wprowadzanie danych. Weź kalkulator graficzny, przejdź do trybu statystycznego i wybierz polecenie Edytuj.

      • Różne kalkulatory wymagają różnych naciśnięć klawiszy. W tym artykule omówiono kalkulator TI-86 firmy Texas Instruments.
      • Aby przejść do trybu obliczeń statystycznych, naciśnij – Stat (nad klawiszem „+”). Następnie naciśnij F2 – Edytuj.
    2. Usuń poprzednio zapisane dane. Większość kalkulatorów przechowuje wprowadzone statystyki do czasu ich usunięcia. Aby uniknąć pomylenia starych danych z nowymi, należy najpierw usunąć wszelkie zapisane informacje.

      • Użyj klawiszy strzałek, aby przesunąć kursor i podświetl nagłówek „xStat”. Następnie naciśnij Clear i Enter, aby usunąć wszystkie wartości wprowadzone w kolumnie xStat.
      • Za pomocą klawiszy strzałek podświetl nagłówek „yStat”. Następnie naciśnij Clear i Enter, aby wyczyścić wszystkie wartości wprowadzone w kolumnie yStat.
    3. Wprowadź dane początkowe. Użyj klawiszy strzałek, aby przesunąć kursor do pierwszej komórki pod nagłówkiem „xStat”. Wprowadź pierwszą wartość i naciśnij Enter. Na dole ekranu wyświetli się „xStat (1) = __”, gdzie zamiast spacji pojawi się wprowadzona wartość. Po naciśnięciu Enter wprowadzona wartość pojawi się w tabeli, a kursor przesunie się do kolejnej linii; spowoduje to wyświetlenie „xStat (2) = __” u dołu ekranu.

      • Wprowadź wszystkie wartości zmiennej „x”.
      • Po wpisaniu wszystkich wartości dla zmiennej x należy za pomocą klawiszy strzałek przejść do kolumny yStat i wprowadzić wartości dla zmiennej y.
      • Po wprowadzeniu wszystkich par liczb naciśnij przycisk Exit, aby wyczyścić ekran i wyjść z trybu obliczeń statystycznych.
    4. Oblicz współczynnik korelacji. Charakteryzuje stopień bliskości danych do określonej linii. Kalkulator graficzny może szybko określić odpowiednią linię i obliczyć współczynnik korelacji.

      • Kliknij Statystyka – Oblicz. W TI-86 musisz nacisnąć – –.
      • Wybierz funkcję „Regresja liniowa”. W TI-86 naciśnij przycisk , który jest oznaczony jako „LinR”. Na ekranie wyświetli się wiersz „LinR_” z migającym kursorem.
      • Teraz wprowadź nazwy dwóch zmiennych: xStat i yStat.
        • W TI-86 otwórz listę nazwisk; W tym celu naciśnij – – .
        • W dolnej linii ekranu zostaną wyświetlone dostępne zmienne. Wybierz (w tym celu prawdopodobnie będziesz musiał nacisnąć klawisz F1 lub F2), wprowadź przecinek, a następnie wybierz .
        • Naciśnij Enter, aby przetworzyć wprowadzone dane.

Etap 3. Znalezienie relacji pomiędzy danymi

Korelacja liniowa

Ostatnim etapem zadania badania powiązań między zjawiskami jest ocena bliskości powiązania za pomocą wskaźników korelacji. Etap ten jest bardzo ważny dla rozpoznania zależności pomiędzy charakterystyką czynnikową i wykonawczą, a co za tym idzie, dla możliwości postawienia diagnozy i prognozy badanego zjawiska.

Diagnoza(z greckiej diagnozy rozpoznanie) - określenie istoty i cech stanu obiektu lub zjawiska na podstawie jego wszechstronnego badania.

Prognoza(z greckiej prognozy, przewidywania) - dowolna konkretna prognoza, ocena stanu dowolnego zjawiska w przyszłości (prognoza pogody, wynik wyborów itp.). Prognoza to naukowo oparta hipoteza dotycząca prawdopodobnego przyszłego stanu badanego systemu, obiektu lub zjawiska oraz wskaźników charakteryzujących ten stan. Prognozowanie – rozwój prognoz, specjalne Badania naukowe konkretne perspektywy rozwoju dowolnego zjawiska.

Przypomnijmy definicję korelacji:

Korelacja– zależność między zmiennymi losowymi, wyrażająca się tym, że rozkład jednej wartości zależy od wartości innej wartości.

Zależność obserwuje się nie tylko między ilościową, ale także znaki jakościowe. Istnieć różne drogi oraz wskaźniki oceny bliskości powiązań. Zatrzymamy się tylko na współczynnik korelacji par liniowych , który jest stosowany, gdy istnieje liniowa zależność między zmiennymi losowymi. W praktyce często zachodzi potrzeba określenia poziomu powiązania pomiędzy zmiennymi losowymi o nierównych wymiarach, dlatego pożądane jest posiadanie jakiejś bezwymiarowej charakterystyki tego powiązania. Taką cechą (miarą powiązania) jest współczynnik korelacji liniowej r xy, co jest określone przez wzór

Gdzie , .

Oznaczając i , możemy otrzymać następujące wyrażenie do obliczenia współczynnika korelacji

.

Jeśli wprowadzimy koncepcję znormalizowane odchylenie , który wyraża odchylenie skorelowanych wartości od średniej w ułamkach odchylenia standardowego:



wówczas wyrażenie na współczynnik korelacji przyjmie postać

.

Jeśli obliczysz współczynnik korelacji na podstawie końcowych wartości oryginalnych zmiennych losowych z tabeli obliczeniowej, wówczas współczynnik korelacji można obliczyć za pomocą wzoru

.

Właściwości współczynnika korelacji liniowej:

1). Współczynnik korelacji jest wielkością bezwymiarową.

2). |R| 1 GBP lub .

3). , a, b= const, – wartość współczynnika korelacji nie ulegnie zmianie, jeśli wszystkie wartości zmiennych losowych X i Y zostaną pomnożone (lub podzielone) przez stałą.

4). , a, b= const, – wartość współczynnika korelacji nie ulegnie zmianie, jeżeli wszystkie wartości zmiennych losowych X i Y zwiększą się (lub zmniejszą) o stałą.

5). Istnieje związek pomiędzy współczynnikiem korelacji a współczynnikiem regresji:

Wartości współczynników korelacji można interpretować w następujący sposób:

Ilościowe kryteria oceny bliskości komunikacji:

Do celów prognostycznych wartości z |r| > 0,7.

Współczynnik korelacji pozwala wnioskować, że pomiędzy dwiema zmiennymi losowymi istnieje liniowa zależność, ale nie wskazuje, która ze zmiennych powoduje zmianę drugiej. W rzeczywistości związek między dwiema zmiennymi losowymi może istnieć bez związku przyczynowo-skutkowego między samymi wartościami, ponieważ zmiana obu zmiennych losowych może być spowodowana zmianą (wpływem) trzeciej.

Współczynnik korelacji r xy jest symetryczny względem branych pod uwagę zmiennych losowych X I Y. Oznacza to, że przy wyznaczaniu współczynnika korelacji jest zupełnie obojętne, która z wielkości jest niezależna, a która zależna.

Znaczenie współczynnika korelacji

Nawet dla zmiennych niezależnych współczynnik korelacji może być różny od zera ze względu na losowe rozproszenie wyników pomiarów lub małą próbkę zmiennych losowych. Należy zatem sprawdzić istotność współczynnika korelacji.

Na podstawie tego sprawdza się istotność współczynnika korelacji liniowej Test t-Studenta :

.

Jeśli T > t kr(P, rz-2), to współczynnik korelacji liniowej jest istotny, a co za tym idzie, istotna jest także zależność statystyczna X I Y.

.

Dla ułatwienia obliczeń stworzono tabele wartości granic ufności współczynników korelacji dla różnych liczb stopni swobody f = rz–2 (test dwustronny) i różne poziomy istotności A= 0,1; 0,05; 0,01 i 0,001. Korelację uznaje się za istotną, jeżeli obliczony współczynnik korelacji przekracza wartość granicy ufności współczynnika korelacji dla danego F I A.

Dla dużych N I A= 0,01 wartość granicy ufności współczynnika korelacji można obliczyć korzystając ze wzoru przybliżonego

.

Współczynnik korelacji to stopień związku między dwiema zmiennymi. Jego obliczenie daje wyobrażenie o tym, czy istnieje związek między dwoma zbiorami danych. W przeciwieństwie do regresji, korelacja nie przewiduje wartości wielkości. Jednak obliczenie współczynnika jest ważny etap wstępna analiza statystyczna. Ustaliliśmy na przykład, że współczynnik korelacji między poziomem bezpośrednich inwestycji zagranicznych a dynamiką PKB jest wysoki. Daje nam to wyobrażenie, że aby zapewnić dobrobyt, konieczne jest stworzenie sprzyjającego klimatu specjalnie dla zagranicznych przedsiębiorców. Na pierwszy rzut oka nie jest to taki oczywisty wniosek!

Korelacja i przyczynowość

Być może nie ma ani jednego obszaru statystyki, który tak mocno ugruntował się w naszym życiu. Współczynnik korelacji stosowany jest we wszystkich obszarach wiedzy społecznej. Jego głównym niebezpieczeństwem jest to, że często spekuluje się na temat jego wysokich wartości, aby przekonać ludzi i przekonać ich do pewnych wniosków. Jednak w rzeczywistości silna korelacja wcale nie wskazuje na związek przyczynowo-skutkowy między wielkościami.

Współczynnik korelacji: wzór Pearsona i Spearmana

Istnieje kilka podstawowych wskaźników charakteryzujących związek pomiędzy dwiema zmiennymi. Historycznie rzecz biorąc, pierwszym jest współczynnik korelacji liniowej Pearsona. Uczy się tego w szkole. Został on opracowany przez K. Pearsona i J. Yule na podstawie pracy ks. Galtona. Współczynnik ten pozwala zobaczyć związek między liczbami wymiernymi, które zmieniają się racjonalnie. Jest zawsze większa niż -1 i mniejsza niż 1. Liczba ujemna oznacza zależność odwrotnie proporcjonalną. Jeśli współczynnik wynosi zero, wówczas nie ma związku między zmiennymi. Równy liczbie dodatniej - istnieje wprost proporcjonalna zależność między badanymi wielkościami. Współczynnik korelacji rang Spearmana pozwala uprościć obliczenia poprzez budowanie hierarchii wartości zmiennych.

Zależności między zmiennymi

Korelacja pomaga odpowiedzieć na dwa pytania. Po pierwsze, czy związek między zmiennymi jest dodatni czy ujemny. Po drugie, jak silne jest uzależnienie. Analiza korelacji to potężne narzędzie, które może dostarczyć tych ważnych informacji. Łatwo zauważyć, że dochody i wydatki rodziny spadają i rosną proporcjonalnie. Zależność tę należy uznać za pozytywną. I odwrotnie, gdy cena produktu rośnie, popyt na niego spada. Zależność tę nazywa się ujemną. Wartości współczynnika korelacji mieszczą się w przedziale od -1 do 1. Zero oznacza, że ​​pomiędzy badanymi wartościami nie ma związku. Im uzyskany wskaźnik jest bliższy wartościom ekstremalnym, tym silniejsza jest zależność (ujemna lub dodatnia). Brak zależności wskazuje współczynnik od -0,1 do 0,1. Musisz zrozumieć, że taka wartość wskazuje jedynie na brak zależności liniowej.

Funkcje aplikacji

Stosowanie obu wskaźników wiąże się z pewnymi założeniami. Po pierwsze, obecność silnego związku nie przesądza o tym, że jedna wielkość determinuje drugą. Być może istnieje trzecia wielkość, która definiuje każdą z nich. Po drugie, wysoki współczynnik korelacji Pearsona nie wskazuje na związek przyczynowo-skutkowy pomiędzy badanymi zmiennymi. Po trzecie, pokazuje wyłącznie zależność liniową. Korelację można zastosować do oceny znaczących danych ilościowych (np. ciśnienia barometrycznego, temperatury powietrza), a nie kategorii takich jak płeć czy ulubiony kolor.

Wielokrotny współczynnik korelacji

Pearson i Spearman zbadali związek między dwiema zmiennymi. Ale co zrobić, jeśli jest ich trzy lub nawet więcej. Tutaj na ratunek przychodzi współczynnik korelacji wielokrotnej. Na przykład na produkt narodowy brutto wpływają nie tylko bezpośrednie inwestycje zagraniczne, ale także polityka monetarna i fiskalna rządu oraz poziom eksportu. Tempo wzrostu i wielkość PKB są efektem współdziałania wielu czynników. Należy jednak zrozumieć, że model korelacji wielokrotnej opiera się na szeregu uproszczeń i założeń. Po pierwsze, wykluczona jest wieloliniowość pomiędzy wartościami. Po drugie, związek między zależnością a zmiennymi na nią wpływającymi uważa się za liniowy.

Obszary zastosowań analizy korelacji i regresji

Ta metoda znajdowania zależności między wielkościami jest szeroko stosowana w statystyce. Najczęściej stosuje się go w trzech głównych przypadkach:

  1. Aby przetestować związki przyczynowo-skutkowe pomiędzy wartościami dwóch zmiennych. W rezultacie badacz ma nadzieję odkryć zależność liniową i wyprowadzić wzór opisujący te zależności między wielkościami. Ich jednostki miary mogą się różnić.
  2. Aby sprawdzić związek między ilościami. W tym przypadku nikt nie określa, która zmienna jest zmienną zależną. Może się okazać, że o wartości obu wielkości decyduje jakiś inny czynnik.
  3. Aby wyprowadzić równanie W takim przypadku możesz po prostu zastąpić w nim liczby i znaleźć wartości nieznanej zmiennej.

Człowiek poszukujący związku przyczynowo-skutkowego

Świadomość jest zaprojektowana w taki sposób, że zdecydowanie musimy wyjaśnić zdarzenia, które dzieją się wokół nas. Człowiek zawsze szuka powiązania pomiędzy obrazem świata, w którym żyje, a informacjami, które otrzymuje. Mózg często tworzy porządek z chaosu. Z łatwością dostrzega związek przyczynowo-skutkowy tam, gdzie go nie ma. Naukowcy muszą w szczególności nauczyć się przezwyciężać tę tendencję. Umiejętność obiektywnej oceny relacji między danymi jest niezbędna w karierze akademickiej.

Stronniczość mediów

Zastanówmy się, jak obecność korelacji może zostać błędnie zinterpretowana. Grupę brytyjskich uczniów zachowujących się niewłaściwie zapytano, czy ich rodzice palą. Następnie test został opublikowany w gazecie. Wyniki wykazały silną korelację pomiędzy paleniem tytoniu przez rodziców a przestępczością ich dzieci. Profesor, który przeprowadził to badanie, zasugerował nawet umieszczenie ostrzeżenia o tym na paczkach papierosów. Jednak istnieje cała linia problemy z tym wnioskiem. Po pierwsze, korelacja nie pokazuje, która z wielkości jest niezależna. Dlatego całkiem możliwe jest założenie, że szkodliwy nawyk rodziców jest spowodowany nieposłuszeństwem dzieci. Po drugie, nie można z całą pewnością stwierdzić, że oba problemy nie powstały na skutek jakiegoś trzeciego czynnika. Na przykład rodziny o niskich dochodach. Warto zwrócić uwagę na emocjonalny aspekt wstępnych ustaleń profesora prowadzącego badanie. Był zagorzałym przeciwnikiem palenia. Nic więc dziwnego, że w ten sposób zinterpretował wyniki swoich badań.

wnioski

Błędne interpretowanie korelacji jako związku przyczynowo-skutkowego pomiędzy dwiema zmiennymi może skutkować haniebnymi błędami badawczymi. Problem w tym, że leży to u samych podstaw ludzkiej świadomości. Wiele chwytów marketingowych opiera się na tej funkcji. Zrozumienie różnicy między przyczyną a skutkiem oraz korelacją pozwala racjonalnie analizować informacje w obu przypadkach Życie codzienne oraz w karierze zawodowej.

Podziel się ze znajomymi lub zapisz dla siebie:

Ładowanie...