Компонентный і факторний анализ
Нас ненормированные головні компоненти. Провівши нормування отриманих зосереджених, одержимо. При нормуванні дисперсія має дорівнювати 1,. Треба лише розділити на среднеквадратическое відхилення. Цю матрицю будуватимемо, з співвідношення, де- діагональна матриця, на головною діагоналі якою стоять дисперсії відповідних головних компонент в мінус першої степени; Означимо — це матриця вагових… Читати ще >
Компонентный і факторний анализ (реферат, курсова, диплом, контрольна)
року міністерство освіти Російської Федерации.
ОРЕНБУРГСКИЙ ДЕРЖАВНИЙ УНИВЕРСИТЕТ.
Фінансово-економічний факультет.
Кафедра МММЭ.
КУРСОВА РАБОТА.
з дисципліни «Багатовимірні статистичні методи «.
Компонентний і факторний анализ.
ОДУ 61 700.5001.06 00.
Керівник работы.
__________________ Реннер А.Г.
«____"_____________2001г.
Исполнитель.
студент гр.99ст.
______________ Рамазанов М.И.
«_____"____________2001г.
Оренбург 2001.
Задание…3 Введение…4.
1 Дослідження на мультиколлинеарность…5.
2 Метод головних компонент…7.
2.1 Обчислення головних компонент…7.
2.2 Економічна інтерпретація отриманих головних компонент…12.
2.3 Матриця наблюденных значень головних компонент…12.
2.4 Класифікація объектов…13.
2.5 Рівняння регресії на головні компоненты…13 3 Факторний анализ…15.
3.1 Перетворення матриці парних коефіцієнтів кореляції в редуцированную матрицю, отримання матриці факторних навантажень ні економічна інтерпретація …16.
3.2 Графічна класифікація об'єктів з двох загальним факторам…19.
3.3 Перехід до узагальненим чинникам з допомогою варимаксного обертання …19.
3.4 Побудова функції регресії виділені загальні факторы…21 Список використаної литературы…22 Приложения…23.
Задание.
За наявними даними виробничо-господарської підприємств машинобудування: Y1 — продуктивності праці; X5 — питому вагу робітників у складі ППП; X6 — питому вагу покупних виробів; X7 — коефіцієнт покупних виробів; X9 — питому вагу збитків шлюбу; X17 — невиробничі витрати. 1. Виявити наявність мультиколлинеарности. 2. Знизити розмірність признакового простору й видалити наявність мультиколлинеарности такими методами: Метод головних компонент:
— для факторних ознак знайти оцінку матриці парних коефіцієнтів кореляції, знайти власні числа і власні вектора;
— виходячи з матриці власних чисел визначити внесок головних компонент в сумарну дисперсию ознак, відібрати і зазначити m (m[pic], то гіпотеза Н0 відхиляється і матриця є значимої, отже, можна буде проводити компонентний анализ.
Перевіримо гіпотезу про диагональности ковариационной матрицы.
Висуваємо гипотезу:
Н0: соv[pic]=0, [pic].
Н1: соv[pic].
Будуємо статистику [pic], розподілено згідно із законом [pic] з [pic] ступенями свободи. [pic]=123,21, [pic](0,05;10) =18,307 т. к [pic]>[pic] то гіпотеза Н0 відхиляється і можна буде проводити компонентний анализ.
Для побудови матриці факторних навантажень необхідно знайти власні числа матриці [pic], вирішивши уравнение[pic].
Використовуємо з цією операції функцію eigenvals системи MathCAD, яка повертає власні числа матрицы:
[pic] Т.к. вихідні дані є вибірку з генеральної сукупності, ми отримали не власні числа [pic] і власні вектора матриці, які оцінки. Нас цікавитиме наскільки «добре» зі статистичної погляду вибіркові характеристики описують відповідні параметри для генеральної совокупности.
Довірчий інтервал для i-го власного числа шукається по формуле:[pic].
Довірчі інтервали для власних чисел у результаті приймають вид:
[pic].
[pic][pic].
Оцінка значення кількох власних чисел потрапляє у довірчий інтервал інших власних чисел. Необхідно перевірити гіпотезу про кратності власних чисел.
Перевірка кратності проводиться за допомогою статистики.
[pic], де r-количество кратних корней.
Ця статистика у разі справедливості [pic]распределена згідно із законом [pic] із кількістю ступенів свободи [pic]. Висунемо гипотезы:[pic][pic].
[pic].
Оскільки [pic], то гіпотеза [pic] відхиляється, тобто власні числа [pic] і [pic] не кратны.
Далее,.
:[pic][pic].
[pic].
Оскільки [pic], то гіпотеза [pic] відхиляється, тобто власні числа [pic] і [pic] не кратны.
:[pic][pic].
[pic].
Оскільки [pic], то гіпотеза [pic] відхиляється, тобто власні числа [pic] і [pic] не кратны.
Слід наголосити головні компоненти лише на рівні інформативності 0,85. Міра інформативності показує яку частину або яку частку дисперсії вихідних ознак становлять k-первых головних компонент. Мірою інформативності називатимемо величину: [pic] I1=[pic]=0,458 I2=[pic]=0,667 I3=[pic] На заданому рівні інформативності виділено три головних компоненты.
Запишемо матрицю [pic]=[pic].
Для отримання нормалізованого вектора переходу від вихідних ознак до головним компонентами вирішити систему рівнянь: [pic], де [pic]- відповідне власне число. Після набуття рішення системи необхідно потім нормувати отриманий вектор.
Аби вирішити даного завдання скористаємося функцією eigenvec системи MathCAD, яка повертає нормований вектор для відповідного власного числа. У нашому випадку перших чотирьох головних компонент достатньо досягнення рівня інформативності, тому матриця U (матриця переходу від вихідного базису до базису власними векторов).
Будуємо матрицю U, стовпчиками якої є власні вектора: U=[pic].
Матриця вагових коэффициентов:
[pic].
[pic] А=[pic].
Коефіцієнти матриці А коефіцієнтами кореляції між центрировано — нормированными вихідними ознаками і ненормованими головними компонентами, і [pic] показують наявність, собі силу й напрям лінійної зв’язок між відповідними вихідними ознаками і відповідними головними компонентами.
2.2 Економічна інтерпретація отриманих головних компонент.
Коефіцієнт [pic] матриці А є коефіцієнти кореляції між i-ой головною компонентом і j-ым вихідним признаком.
Оскільки перша головна компонента залежить головним чином першого (X5 — питому вагу робітників у складі ППП) і третього (X7 — коефіцієнт змінності устаткування) вихідного ознаки, отже яку можна позначити як «Ефективність основного виробництва». Друга головна компонента тісно взаємозалежна з іншим (X6 — питому вагу покупних виробів) і четвертим (X9 — питому вагу збитків шлюбу) вихідними ознаками, яку можна позначити як «Питома вага витрат не приносять прибуток». Третя головна компонента взаємозалежна з четвертим вихідним ознакою, тому її позначимо «Питома вага збитків брака».
2.3 Матриця наблюденных значень головних компонент.
Нас ненормированные головні компоненти. Провівши нормування отриманих зосереджених [pic], одержимо [pic]. При нормуванні [pic] дисперсія має дорівнювати 1, [pic]. Треба лише розділити [pic] на среднеквадратическое відхилення [pic]. [pic].
Означимо [pic] - це матриця вагових коефіцієнтів, з допомогою якій буде встановлено зв’язок між нормированными вихідними ознаками і нормированными головними компонентами.
Модель методу головних компонент:
[pic] де [pic]- значення I-той стандартизованої перемінної по j-ому об'єкту спостереження; [pic]- m-тая головна компоненти за j-ому об'єкту наблюдения;
[pic]- ваговій коефіцієнт m-той головною компоненти і I-той переменной.
Цю матрицю будуватимемо, з співвідношення [pic], де [pic]- діагональна матриця, на головною діагоналі якою стоять дисперсії відповідних головних компонент в мінус першої степени;
[pic] - транспонированная матриця факторних нагрузок;
Хматриця наблюденных значень вихідних признаков.
Ця формула хороша тим, що правильна у тому разі, якщо матриця, А квадратна (тобто. виділено m.