Industrialnet Головна Про сайт webcache.site checkip.site takescreenshot.site
  • Строрінки

  • Кореляційно-регресійний аналіз

    Зведення і групування

    Зведення і групування статистичних даних

    Ряди розподілу

    Генеральна сукупність і вибірковий метод

    Ряди динаміки

    Таблиця Стьюдента

  • Кореляційно-регресійний аналіз
  • Загальна теорія статистики
  • Предмет статистики
  • Основні методи і завдання статистики
  • Економічні індекси та індексний метод
  • Показники варіації
  • Зміст
  • Методи вивчення взаємозв'язку соціально-економічних явищ з допомогою кореляційно-регресивного аналізу
  • Лінійна кореляція
  • Методи вивчення взаємозв'язку соціально-економічних явищ з допомогою кореляційно-регресивного аналізу Загальне уявлення про кореляційно-регресивний аналіз

    Існуючі між явищами форми та види зв'язків вельми різноманітні по своїй класифікації. Предметом статистики є тільки такі з них, які мають кількісний характер і вивчаються з допомогою кількісних методів. Розглянемо метод кореляційно-регресійного аналізу, який є основним у вивченні взаємозв'язків явищ.

    Даний метод містить дві свої складові частини — кореляційний аналіз та регресійний аналіз. Кореляційний аналіз — це кількісний метод визначення тісноти і напрямки взаємозв'язку між вибірковими змінними величинами. Регресійний аналіз — це кількісний метод визначення виду математичної функції в причинно-наслідкової залежності між змінними величинами.

    Для оцінки сили зв'язку в теорії кореляції застосовується шкала англійського статистика Чеддока: слабка — від 0,1 до 0,3; помірна — від 0,3 до 0,5; помітна — від 0,5 до 0,7; висока — від 0,7 до 0,9; досить висока (сильна) — від 0,9 до 1,0. Вона використовується далі в прикладах по темі.

    Лінійна кореляція

    Дана кореляція характеризує лінійну взаємозв'язок у варіаціях змінних. Вона може бути парною (дві корельовані змінні) або множинної (більш двох перемінних), прямої або зворотної — позитивною або негативною, коли змінні варіюють відповідно в однакових або різних напрямках.

    Якщо змінні — кількісні і рівноцінні в своїх незалежних спостереженнях при їх загальній кількості , то найважливішими емпіричними заходами тісноти їх лінійної взаємозв'язку є коефіцієнт прямої кореляції знаків австрійського психолога Р. Т. Фехнера (1801-1887) та коефіцієнти парної, чистої (приватної) і множинної (сукупної) кореляції англійського статистика-біометрика К. Пірсон (1857-1936).

    Коефіцієнт парної кореляції знаків Фехнера визначає узгодженість напрямків в індивідуальних відхилення змінних і від своїх середніх і . Він дорівнює відношенню різниці сум співпадаючих () і незбіжних () пар знаків у відхиленнях і до суми цих сум:

    Величина Кф змінюється від -1 до +1. Підсумовування в (1) проводиться за спостереженнями, які не вказані у сумах заради спрощення. Якщо якесь одне відхилення або , то воно не входить у розрахунок. Якщо ж відразу обидва відхилення нульові: , то такий випадок вважається збігається за знаками і входить до складу . В таблиці 12.1. показана підготовка даних для розрахунку (1).

    Таблиця 12.1 Дані для розрахунку коефіцієнта Фехнера.

    Магазин

    Кількість працівників, тис. чол.

    Товарообіг, у.е.

    Відхилення від середніх

    і

    Порівняння знаків і

    співпала-ження
    (до)

    несов-падіння (Мдо)

    1

    0,2

    3,1

    +0,0

    -0,9

    0

    1

    2

    0,1

    3,1

    -0,1

    -0,9

    1

    0

    3

    0,4

    5,0

    +0,2

    +1,0

    1

    0

    4

    0,2

    4,4

    +0,0

    +0,4

    1

    0

    5

    0,1

    4,4

    -0,1

    +0,4

    0

    1

    Разом

    1,0

    20,0

    -

    -

    3

    2

    З (1) маємо Доф = (3 — 2)/(3 + 2) = 0,20. Напрямок взаємозв'язку у варіаціях !!Середня чисельність працівників|чисельність працівників]] та обсягу товарообігу — позитивне (прямолінійний): знаки у відхиленнях і і в своїй більшості (у 3 випадках із 5) збігаються між собою. Тіснота взаємозв'язку змінних за шкалою Чеддока — слабка.

    Коефіцієнти парної, чистої (приватної) і множинної (сукупної) лінійної кореляції Пірсона, на відміну від коефіцієнта Фехнера, враховують не тільки знаки, але і величини відхилень змінних. Для їх розрахунку використовують різні методи. Так, згідно з методом прямого рахунку по несгруппированным даними, коефіцієнт парної кореляції Пірсона має вигляд:

    Цей коефіцієнт змінюється від -1 до +1. При наявності декількох змінних розраховується коефіцієнт множинної (сукупної) лінійної кореляції Пірсона. Для трьох змінних x, y, z він має вигляд

    Цей коефіцієнт змінюється від 0 до 1. Якщо елімінувати (зовсім виключити або зафіксувати на постійному рівні) вплив на і , то їх "загальна" зв'язок перетвориться на "чисту", утворюючи чистий (приватний) коефіцієнт лінійної кореляції Пірсона:

    Цей коефіцієнт змінюється від -1 до +1. Квадрати коефіцієнтів кореляції (2)-(4) називаються коефіцієнтами (індексами) детермінації — відповідно парної, чистої (приватної), множинної (сукупної):

    Кожен з коефіцієнтів детермінації змінюється від 0 до 1 і оцінює ступінь варіаційної визначеності в лінійній взаємозв'язку змінних, показуючи частку варіації однієї змінної (y), обумовлену варіацією іншого (інших) — x і y. Багатомірний випадок наявності більше трьох змінних тут не розглядається.

    Згідно розробкам англійського статистика Н. Е. Фішер (1890-1962), статистична значимість парного і чистого (приватного) коефіцієнтів кореляції Пірсона перевіряється у разі нормальності розподілу, на підставі -розподілу англійського статистика В. С. Госсета (псевдонім "Стьюдент"; 1876-1937) з заданим рівнем ймовірнісної значущості і наявні ступені свободи , де — число зв'язків (факторних змінних). Для парного коефіцієнта маємо його среднеквадратическую помилку і фактичне значення -критерію Стьюдента:

    Для чистого коефіцієнта кореляції при розрахунку його замість (n-2) треба брати , оскільки в цьому випадку мається m=2 (дві факторні змінні x і z). При великому числі n>100 замість (n-2) або (n-3) (6) можна брати n, нехтуючи точністю розрахунку.

    Якщо tr > tтабл. , коефіцієнт парної кореляції — загальний або чистий є статистично значущим, а при tr ? tтабл. — незначущу.

    Значимість коефіцієнта множинної кореляції R перевіряється за F — критерієм Фішера шляхом розрахунку його фактичного значення

    При FR > Fтабл. коефіцієнт R вважається значущим з заданим рівнем значущості a і наявних ступенях свободи і , а при Fr? Fтабл — незначущу.

    В сукупностях великого об'єму n > 100 для оцінки значимості всіх коефіцієнтів Пірсона замість критеріїв t і F застосовується безпосередньо нормальний закон розподілу (табулированная функція Лапласа-Шеппарда).

    Нарешті, якщо коефіцієнти Пірсона не підпорядковуються нормальному закону, то в якості критерію їх значущості використовується Z — критерій Фішера, який тут не розглядається.

    Умовний приклад розрахунку (2) — (7) дано в табл. 12.2, де взято вихідні дані табл.12.1 з доданням до них третьої змінної z — розміру загальної площі магазину (100 кв. м).

    Таблиця 12.2. Підготовка даних для розрахунку коефіцієнтів кореляції Пірсона

    Мага-зин

    Показники

    до

    xk

    yk

    zk

    xkyk

    xkzk

    ykzk

    1

    0,2

    3,1

    0,1

    0,62

    0,02

    0,31

    0,04

    9,61

    0,01

    2

    0,1

    3,1

    0,1

    0,31

    0,01

    0,31

    0,01

    9,61

    0,01

    3

    0,4

    5,0

    1,0

    2,00

    0,40

    5,00

    0,16

    25,00

    1,00

    4

    0,2

    4,4

    0,2

    0,88

    0,04

    0,88

    0,04

    19,36

    0,04

    5

    0,1

    4,4

    0,6

    0,44

    0,06

    2,64

    0,01

    19,36

    0,36

    Разом

    1,0

    20,0

    2,0

    4,25

    0,53

    9,14

    0,26

    82,94

    1,42

    Згідно (2) — (5), коефіцієнти лінійної кореляції Пірсона рівні:

    Взаємозв'язок змінних x і y є позитивною, але не тісним, складаючи по їх парного коефіцієнту кореляції величину і по чистому — величину і оцінювалася за шкалою Чеддока відповідно як "помітна" і "слабка".

    Коефіцієнти детермінації dxy =0,354 і dxy.z = 0,0037 свідчать, що варіація у (товарообігу) обумовлена лінійної варіацією x (чисельності працівників) на 35,4% до їх загальної взаємозв'язку і в чистій взаємозв'язку — лише на 0,37%. Таке становище зумовлено значним впливом на x і y третьої змінної z — займаної магазинами загальної площі. Тіснота її взаємозв'язку з ними становить відповідно rxz=0,677 і ryz=0,844.

    Коефіцієнт множинної (сукупної) кореляції трьох змінних показує, що тіснота лінійної взаємозв'язку x і z c y складає величину R = 0,844, оцінюючи за шкалою Чеддока як "висока", а множинний коефіцієнт детермінації — величину D=0,713, засвідчуючи, що 71,3 % всієї варіації у (товарообігу) обумовлені сукупним впливом на неї змінних x і z. Інші 28,7% обумовлені впливом на y інших чинників або ж криволінійної зв'язком змінних y, x, z.

    Для оцінки значимості коефіцієнтів кореляції візьмемо рівень значущості . З вихідних даних маємо ступеня свободи для і для . З теоретичної таблиці знаходимо відповідно tтабл.1. = 3,182 і tтабл.2. = 4,303. Для F-критерію маємо і і по таблиці знаходимо Fтабл. = 19,0. Фактичні значення кожного критерію (6) і (7) дорівнюють:

    Всі розрахункові критерії менше своїх табличних значень: всі коефіцієнти кореляції Пірсона статистично незначимы.

    Copyright © industrialnet.com.ua. 2016 • All rights reserved.