Использование корреляционно-регрессионного аналізу в обробці економічних статистичних данных
Інтерпретація моделей регресії здійснюється методами тієї галузі знань, до якої належить досліджувані явища. Будь-яка інтерпретація починається з статистичної оцінки рівняння регресії загалом з оцінкою значимості які входять у модель факторних ознак, тобто. з вивчення, як вони впливають на величину результативного ознаки. Чим більший величина коефіцієнта регресії, то більша вплив даного ознаки… Читати ще >
Использование корреляционно-регрессионного аналізу в обробці економічних статистичних данных (реферат, курсова, диплом, контрольна)
року міністерство освіти Російської Федерации.
Івановський державний университет.
Фізичний факультет.
Кафедра теоретичної физики,.
математичного і комп’ютерного моделирования.
КУРСОВА РОБОТА на тему.
«Використання корреляционно-регрессионного аналізу в обробці економічних статистичних данных».
Виконав: студент 3 курсу Одинокий А.В.
Науковий керівник: доцент Озерова В.М.
Іваново 2002.
1.
Введение
.
2. Роль корреляцонно-регрессионного аналізу, у обробці економічних данных.
3. Корреляционно-регрессионный аналіз політики та його возможности.
4. Передумови кореляційного і регресійного анализа.
5. Пакет аналізу Microsoft Excel.
6.
Заключение
.
7. Література Введение.
Обробка статистичних даних віддавна застосовується у самих різноманітні види людської діяльності. Власне кажучи, важко полягає в тому сферу, де вона би використовувалася. Але, мабуть, ні з області знань і з практичної діяльності обробка статистичних даних не грає такий виключно великий ролі, як і економіці, має працювати з обробкою й аналізом величезних масивів інформації про соціально-економічних явищах і процесах. Всебічний та глибокий аналіз цієї інформації, про статистичних даних, передбачає використання різних спеціальних методів, важливе місце серед яких займає кореляційний і регресійний аналізи обробки статистичних данных.
У економічних дослідженнях часто вирішують завдання виявлення чинників, визначальних рівень цін та динаміку економічного процесу. Таке завдання частіше всього вирішується методами кореляційного і регресійного аналізу. Для достовірного відображення об'єктивно що у економіці процесів необхідно виявити суттєві взаємозв'язок харчування та як виявити, а й дати їм кількісну оцінку. Такий підхід вимагає розтину причинних залежностей. Під причинної залежністю розуміється така зв’язок між процесами, коли зміна однієї з них наслідком зміни другого.
Основними завданнями кореляційного аналізу є оцінка сили зв’язку і перевірка статистичних гіпотез про наявність про силу кореляційної зв’язку. Не все чинники, що впливають економічні процеси, випадкові величинами, тому під час аналізу економічних явищ зазвичай розглядаються зв’язок між випадковими й невипадковими величинами. Такі зв’язку називаються регрессионными, а метод математичної статистики, їх вивчав, називається регрессионным анализом.
Використання можливостей сучасної обчислювальної техніки, оснащеною пакетами програм машинної обробки статистичної інформації на ЕОМ, робить практично здійсненним оперативне вирішення завдань вивчення взаємозв'язку показників біржових ставок методами корреляционнорегресійного анализа.
При машинної обробці вихідної інформації на ЕОМ, оснащених пакетами стандартних програм ведення аналізів, обчислення параметрів застосовуваних математичних функцій є швидко виконуваної лічильної операцией.
Ця робота присвячена вивченню можливості обробки статистичних даних біржових ставок методами кореляційного і регресійного аналізу з використанням пакета прикладних програм Microsoft Excel.
Роль корреляцонно-регрессионного аналізу, у обробці економічних данных.
Кореляційний аналіз стану та регресійний аналіз є суміжними розділами математичної статисти та призначаються з вивчення по вибірковим даним статистичної залежності низки величин; що з яких випадкові. При статистичної залежності величини не пов’язані функціонально, але, як випадкові величини задано спільним розподілом ймовірностей. Дослідження взаємозв'язку випадкових величин біржових ставок призводить до теорії кореляції, як поділу теорії ймовірностей і корреляционному аналізу, як поділу математичної статистики. Дослідження залежності випадкових величин призводить до моделям регресії і регрессионному аналізу з урахуванням вибіркових даних. Теорія ймовірностей і математична статистика становлять лише інструмент для вивчення статистичної залежності, але з ставлять за мету встановлення причинного зв’язку. Уявлення і гіпотези про причинного зв’язку повинні прагнути бути привнесені з деякою інший теорії, що дозволяє змістовно пояснити досліджуване явление.
Формально кореляційна модель взаємозв'язку системи випадкових величин [pic]может бути представленій у наступному вигляді: [pic], де Z — набір випадкових величин, що впливають на студійовані випадкові величины.
Економічні дані майже завжди представлені у вигляді таблиць. Числові дані, які у таблицях, зазвичай мають між собою явні (відомі) чи неявні (приховані) связи.
Явно пов’язані показники, які отримані методами прямого рахунки, т. е. враховано із заздалегідь відомим формулам. Наприклад, відсотки виконання плану, рівні, удільні ваги, відхилення у сумі, відхилення у відсотках, темпи зростання, темпи приросту, індекси тощо. д.
Зв’язки ж другого типу (неявні) заздалегідь невідомі. Але потрібно вміти пояснювати і пророкувати (прогнозувати) складні явища у тому, щоб керувати ними. Тому фахівці з допомогою спостережень прагнуть виявити приховані залежності і пропозицією висловити у вигляді формул, т. е. математично змоделювати явища чи процеси. На одній із таких можливостей надає корреляционно-регрессионный анализ.
Математичні моделі будуються й йдуть на трьох узагальнених целей:
• для объяснения;
• для предсказания;
• для управления.
Уявлення економічних пріоритетів і інших даних в електронних таблицях в наші дні стало простою й природним. Оснащення ж електронних таблиць засобами корреляционно-регрессионного аналізу сприяє з того що з групи складних, глибоко своїх наукових та тому рідко використовуваних, майже екзотичних методів, корреляционно-регрессионный аналіз перетворюється для спеціаліста у повсякденний, ефективний і оперативний аналітичний інструмент. Проте, через її складності, освоєння його потребує значно великих знань й зусиль, ніж освоєння простих електронних таблиц.
Користуючись методами корреляционно-регрессионного аналізу, аналітики вимірюють тісноту зв’язків показників з допомогою коефіцієнта кореляції. При цьому виявляються зв’язку, різні за силою (сильні, слабкі, помірні і ін.) й різні в напрямі (прямі, зворотні). Якщо зв’язку виявляться суттєвими, то доцільно знайти їх математичне вираження у вигляді регресійної моделі і оцінити статистичну значимість моделі. У економіці значиме рівняння використовується, зазвичай, для прогнозування досліджуваного явища чи показателя.
Регресійний аналіз називають основним методом сучасної математичної статистики виявлення неявних і завуальованих зв’язків між даними спостережень. Електронні таблиці роблять такий аналіз легко доступним. Отже, регресивні обчислення і добір хороших рівнянь — це цінний, універсальний дослідницький інструмент в різноманітних галузях бізнесової й наукової діяльності (маркетинг, торгівля, медицина тощо. буд.). Засвоївши технологію використання цього інструмента, можна застосовувати його життя необхідності, одержуючи знання про прихованих зв’язках, поліпшуючи аналітичну підтримку прийняття прийняття рішень та підвищуючи їх обоснованность.
Корреляционно-регрессионный аналіз вважається однією з головних методів в маркетингу, поруч із оптимизационными розрахунками, і навіть математичним і графічним моделюванням трендів (тенденцій). Широко застосовуються як однофакторні, і множинні регресивні модели.
Корреляционно-регрессионный аналіз стану і його возможности.
Кореляційний аналіз одна із методів статистичного аналізу взаємозв'язку кількох признаков.
Він окреслюється метод, застосовуваний тоді, коли дані спостереження вважатимуться випадковими і обраними з генеральної сукупності, розподіленої по багатовимірному нормальному закону. Основне завдання кореляційного аналізу (що є основний рахунок і в регрессионном аналізі) полягає у оцінці рівняння регрессии.
Кореляція — це статистична залежність між випадковими величинами, які мають суворо функціонального характеру, коли він зміна одній з випадкових величин призводить до зміни математичного очікування інший. 1. Парна кореляція — зв’язок між двома ознаками (результативним і факторным чи двома факторными). 2. Приватна кореляція — залежність між результативним і одного факторным ознаками при фіксованому значенні інших факторних ознак. 3. Множинна кореляція — залежність результативного і двох чи більше факторних ознак, включених в исследование.
Кореляційний аналіз має власної завданням кількісне визначення тісноти зв’язок між двома ознаками (при парній зв’язку) та між результативним ознакою і безліччю факторних ознак (при многофакторной связи).
Тіснота зв’язку кількісно виражається величиною коефіцієнтів кореляції. Коефіцієнти кореляції, представляючи кількісну характеристику тісноти зв’язок між ознаками, дають можливість визначити «корисність» факторних ознак при побудові рівнянь множинної регресії. Розмір коефіцієнтів кореляції служить також оцінкою відповідності рівнянню регресії виявленими причинно-наслідковим связям.
Спочатку дослідження кореляції проводились біології, а пізніше поширилися і інші області, зокрема на соціальноекономічну. Поруч із кореляцією початку вживатись і регресія. Кореляція і регресія тісно пов’язані між собою: перша оцінює силу (тісноту) статистичної зв’язку, друга досліджує її форму. І кореляція, і регресія служать задля встановлення співвідношень між явищами й у визначення наявності або відсутність зв’язок між ними.
Предпосылки кореляційного і регресійного анализа.
Перед розглядом передумов кореляційного і регресійного аналізу, слід зазначити, що загальним умовою, що дозволяє отримати стабільні результати при побудові кореляційних і регресійних моделей біржових ставок, є вимога однорідності вихідної інформації. Ця інформація мусить бути оброблена щодо аномальних, тобто. різко які виділяються з масиву даних, спостережень. Цю процедуру виконується за рахунок кількісної оцінки однорідності сукупності по якомусь одномерному чи багатовимірному критерію (залежно від вихідної інформації) і має мета тих об'єктів спостереження, які мають найкраще (чи найгірше) умови функціонування по які залежать чи слабко залежним причинам.
Після опрацювання даних щодо «аномальності» слід провести перевірку, наскільки що залишилося інформація задовольняє передумов для використання статичного апарату при побудові моделей, оскільки навіть незначні відступу від цих коштів передумов часто зводять нанівець отримуваний ефект. Слід враховувати, що ймовірнісна чи статистичне розв’язання будь-якої економічної завдання повинна грунтуватися на докладному осмисленні вихідних математичних понять та їх передумов, коректності і об'єктивності збору вихідної інформації, у постійному поєднані із тіснявою зв’язку економічного і математико-статистического анализа.
Для застосування кореляційного аналізу необхідно, щоб усе аналізовані перемінні були випадковими і мали нормальний закон розподілу. Причому виконання цих умов необхідно лише за вероятностной оцінці виявленої тісноти связи.
Розглянемо найпростіші випадок виявлення тісноти зв’язку — двумерную модель кореляційного анализа.
Для характеристики тісноти зв’язок між двома перемінними зазвичай користуються парним коефіцієнтом кореляції [pic], якщо розглядати генеральну сукупність, або його оцінкою — вибірковим парним коефіцієнтом [pic], якщо вивчається вибіркова сукупність. Подвійний коефіцієнт кореляції у разі лінійної форми зв’язку обчислюють по формуле.
[pic], яке вибіркове значення — за такою формулою [pic].
При малому числі спостережень вибірковий коефіцієнт кореляції зручно вираховуватимуть за такою формуле:
[pic].
Розмір коефіцієнта кореляції змінюється в інтервалі [pic].
При [pic] між двома перемінними існує функціональна зв’язок, при [pic] - пряма функціональна зв’язок. Якщо [pic], ті значення Х і У в вибірці некоррелированы; у разі, якщо система випадкових величин [pic] має двовимірне нормальне розподіл, то величини Х і У будуть і независимыми.
Якщо коефіцієнт кореляції перебуває у інтервалі [pic], то між величинами Х і У існує зворотна кореляційна зв’язок. Це знаходить підтвердження і за візуальному аналізі вихідної інформації. І тут відхилення величини У від середнього значення взято зі зворотним знаком.
Якщо кожне подружжя значень величин Х і У найчастіше одночасно буде вищою (нижче) відповідних середніх значень, то між величинами є прямий кореляційна зв’язок і коефіцієнт кореляції перебуває у інтервалі [pic].
Якщо ж відхилення величини Х від середнього значення однаково часто викликають відхилення величини У вниз від середнього значення й у своїй відхилення виявляються постійно різними, можна припускати, що значення коефіцієнта кореляції прагне нулю.
Слід зазначити, що значення коефіцієнта кореляції залежить від одиниць вимірювання, і вибору початку відліку. Це означає, що й перемінні Х і У зменшити (збільшити) в До раз або одне і те число З, то коефіцієнт кореляції не зміниться. Пакет аналізу Microsoft Excel.
До складу Microsoft Excel входить набір коштів аналізу даних (так званим пакетом аналізу), готовий до розв’язання складних статистичних і інженерних завдань. Для проведення аналізу даних із допомогою цих інструментів слід зазначити вхідні дані і вибрати параметри; аналіз проведуть з допомогою підходящої статистичної чи інженерної макрофункции, а результат буде поміщений у вихідний діапазон. Інші кошти дозволяють уявити результати аналізу, у графічному виде.
Графічні зображення використовуються передусім на наочного уявлення статистичних даних, завдяки їм істотно полегшується їх сприйняття й розуміння. Істотною є їх роль і тоді, коли йдеться про контролі повноти і достовірності вихідного статистичного матеріалу, використовуваного в обробці і анализа.
Статистичні дані наводяться як довгих і складних статистичних таблиць (див., наприклад, табл.1), тому буває дуже важко знайти у них наявні неточності і ошибки.
Графічне ж уявлення статистичних даних допомагає легко і швидко виявити нічим не виправдані піки і западини, року відповідні зображуваним статистичних даних, аномалії і відхилення. На графіці, побудованому на даним таблиці 1 (мал.1), наочно показано розподіл курсу біржових ставок залежність від часу укладання угоди і угоди рублях.
Графічне уявлення статистичних даних не лише засобом ілюстрації статистичних даних, і контролю їх правильності і достовірності. Завдяки своїм властивостями є важливим засобом тлумачення і політичного аналізу статистичних даних, а окремих випадках — єдиним і незамінним способом їх узагальнення і пізнання. Зокрема, воно незамінно за одночасного вивченні кількох взаємозалежних економічних явищ, оскільки дозволяє собі з першого погляду встановити що існують між ними співвідношення та зв’язку, відмінність і подобу, і навіть виявити особливості їх змін у времени.
Проте, щоб ефективніше використовувати графічні зображення статистичних даних, необхідно опанувати методикою і технікою їх побудови. До цього слід додати, що побудоване графічне зображення статистичних даних біржових ставок найбільшою мірою відповідає характером і змісту зображуваних даних, і поставленої завданню їх анализа.
|Час |Ціна угоди | | |в рублях | |11:16:45 |99,45 | |11:21:53 |99,4 | |11:23:09 |99,31 | |11:23:37 |99,31 | |11:24:49 |99 | |11:24:57 |99 | |11:48:40 |98,61 | |11:49:45 |98,99 | |11:53:51 |98,66 | |11:55:05 |98,65 | |11:55:24 |98,7 | |11:58:18 |98,8 | |11:58:18 |98,8 | |11:58:24 |98,65 | |11:58:35 |98,8 |.
Таблиця 1. Вибірка біржових ставок щодо часу скоєння угоди та ціни угоди рублях за день роботи биржи.
[pic] Мал.1 Розподіл курсу біржових ставок залежність від часу укладання угоди і угоди рублях. Кореляція — одне із інструментів пакета аналізу Microsoft Excel. Використовується для кількісної оцінки взаємозв'язку двох наборів даних, які у безрозмірному вигляді. Коефіцієнт кореляції вибірки є ковариацию двох наборів даних, поділену на твір їх стандартних отклонений.
Кореляційний аналіз дає можливість встановити асоційовані чи набори даних із величині, тобто: великі значення вже з набору даних пов’язані з більшими на значеннями іншого набору (позитивна кореляція); чи, навпаки, малі значення одного набору пов’язані з більшими на значеннями іншого (негативна кореляція); чи дані двох діапазонів неможливо пов’язані (кореляція близька до нулю).
Регресія є також інструментом пакета аналізу даних Microsoft Excel. Лінійний регресійний аналіз залежить від доборі графіка для набору спостережень з допомогою методу найменших квадратів. Регресія використовується для аналізу на окрему залежну зміну значень одного чи більш незалежних змінних. Наприклад, на курс біржових ставок впливають кілька чинників, зокрема такі, як час скоєння угоди та її ціна. Регресія пропорційно розподіляє міру якості по цим двом чинникам з урахуванням даних функціонування курсу біржових ставок. Результати регресії можна використовувати для передбачення якостей нових, не скоєних ще біржових угод. Наприклад, використовуючи результати таблиці 1, можна з допомогою регресії передбачити ціни наступних сделок.
|Наблюдение |Передвіщена ціна угоди в|Остатки | | |рублях | | |1 |72,22 015 |27,22 985 | |2 |72,76 796 |26,63 204 | |3 |72,90 313 |26,40 687 | |4 |72,95 293 |26,35 707 | |5 |73,8 099 |25,91 901 | |6 |73,9 522 |25,90 478 | |7 |75,62 617 |22,98 383 | |8 |75,74 178 |23,24 822 | |9 |76,17 932 |22,48 068 | |10 |76,31 094 |22,33 906 | |11 |76,34 473 |22,35 527 | |12 |76,65 421 |22,14 579 | |13 |76,65 421 |22,14 579 | |14 |76,66 488 |21,98 512 | |15 |76,68 444 |22,11 556 |.
Табл.2. Передвіщена ціна угоди рублях.
Заключение
.
Найскладнішим етапом, завершальним регресійний аналіз, є інтерпретація отриманих результатів, тобто. переклад його з мови статисти та математики мовою экономики.
Інтерпретація моделей регресії здійснюється методами тієї галузі знань, до якої належить досліджувані явища. Будь-яка інтерпретація починається з статистичної оцінки рівняння регресії загалом з оцінкою значимості які входять у модель факторних ознак, тобто. з вивчення, як вони впливають на величину результативного ознаки. Чим більший величина коефіцієнта регресії, то більша вплив даного ознаки на моделируемую обробку біржових ставок. Особливого значення у своїй має знак перед коефіцієнтом регресії. Знаки коефіцієнтів регресії говорять про характері впливу результативний ознака статистичної обробки біржових ставок. Якщо факторний ознака має плюс, те з збільшенням даного чинника результативний ознака зростає; якщо факторний ознака зі знаком мінус, те з його збільшенням результативний ознака зменшується. Інтерпретація цих знаків повністю визначається соціально-економічним змістом моделируемого ознаки. Якщо його величина змінюється убік збільшення, то плюсові знаки факторних ознак мають позитивне вплив. При зміні результативного ознаки у бік зниження позитивні значення мають мінусові знаки факторних ознак. Якщо економічна теорія підказує, що факторний ознака повинен мати позитивне значення, і зі знаком мінус, необхідно перевірити розрахунки параметрів рівняння регрессии.
Кореляційний і регресійний аналіз дозволяє визначити залежність між чинниками, а як і простежити вплив задіяних чинників. Ці показники мають широке використання у обробці статистичних даних для досягнення найкращих показників біржових ставок.
1. В. А. Колемаев, О.В. Старовірів, В. Б. Турундаевский «Теорія ймовірностей і математична сатистика"/ М., 1991.
2. «Теорія Статистики» під редакцією Р.А. Шмойловой/ «ФиС», 1998.
3. «Багатомірний статистичний аналіз на ЭBM з допомогою пакета Microsoft Excel"/ М., 1997.
4. А. А. Френкель, Є.В. Адамова «Корреляционно регресійний аналіз в економічних додатках"/ М., 1987.
5. И. Д. Одинцов «Теорія статистики"/ М., 1998.
6. О. Н. Кленин, К. К. Шевченка «Математична статистика для экономистов-статистиков"/ М., 1990.