Взаимосвязь между дискриминантными переменными и дискриминантными функциями

Расчет коэффициентов дискриминантной функции Классификация при наличии k обучающих выборок Взаимосвязь между дискриминантными переменными и дискриминантными функциями

21725

знаков

таблицы

изображений

Классификация при наличии k обучающих выборок

5. Взаимосвязь между дискриминантными переменными и дискриминантными функциями

Для оценки вклада отдельной переменной в значение дискриминантной функции целесообразно пользоваться стандартизованными коэффициентами дискриминантной функции. Стандартизованные коэффициенты можно рассчитать двумя путями:

·стандартизовать значения исходных переменных таким образом, чтобы их средние значения были равны нулю, а' дисперсии - единице;

·вычислить стандартизованные коэффициенты исходя из значений коэффициентов в нестандартной форме:

(28)

где р - общее число исходных переменных, т - число групп, - элементы матрицы ковариаций:

(29)

где i - номер наблюдения, j - номер переменной, k - номер класса, - количество объектов в k-м классе.

Стандартизованные коэффициенты применяют в тех случаях, когда нужно определить, какая из используемых переменных вносит наибольший вклад в величину дискриминантной функции. В примере с двумя классами, рассмотренном выше, дискриминантная функция имела вид:

f= -185,03Х₁ + 1,84Х₂ + 4,92Х_з .

Следовательно, наибольший вклад в величину дискриминантной функции вносит переменная X₁.

Определим значения стандартизованных коэффициентов и запишем новое значение дискриминантной функции:

(30)

где =

Стандартизованные коэффициенты дискриминантной функции тоже показывают определяющее влияние первой переменной на величину дискриминантной функции.

Помимо определения вклада каждой исходной переменной в дискриминантную функцию, можно проанализировать и степень корреляционной зависимости между ними.

Для оценки тесноты связи между отдельными переменными и дискриминантными функциями служат коэффициенты корреляции, которые называются структурными коэффициентами. По величине структурных коэффициентов судят о связи между переменными и дискриминантными функциями. Структурные коэффициенты позволяют также в случае необходимости присвоить имя каждой функции. Они могут быть рассчитаны в целом по всей совокупности объектов (R) и для каждого класса отдельно (R).

Покажем на примере 1 расчет структурных коэффициентов в целом для трех классов. Исходные данные для расчета коэффициентов представлены в табл. 3. Вычисленные структурные коэффициенты (Rf) имеют следующие значения:

R_x₁_f= 0,650 R_X₂_f = -0,576 R_ХЗ_f = -0,506 R_x₄_f = -0,951

R_x₁_jl = -0,036 R_x₂_j₁ = 0,486 R_хЗ_jl = -0,211 R_x₄_j₁ = 0,217

R_x₁_f₂ = -0,728 R_x₂_f₂ = 0,878 R_ХЗ_f₂ = 0,511 R_x₄_f₂ = -0,998

R_x₁_fJ = -0,713 R_х1_J_З = 0,258 R_хЗ_fJ = -0,122 R_x₄_fJ = -0,998.

Таблица 3 – Исходные данные

Номер	Х1	Х₂	Х_З	Х₄
наблюдения	Х1	Х₂	Х_З	Х₄
1	0,50	94,0	8,50	6707	-31973,089
2	0,67	75,4	8,79	5037	-18122,238
3	0,68	85,2	9,10	3695	-6930,930
4	0,55	98,8	8,47	6815	-32812,109
5	1,52	81,5	4,95	3211	-13434,229
6	1,20	93,8	6,95	2890	-10812,723
7	1,46	86,5	4,70	2935	-11139,514
8	1,70	80,0	4,50	3510	-14272,295
9	1,65	85,0	4,80	2900	-9573,076
10	1,49	78,5	4,10	2850	-9348,104

Если рассматривать абсолютные значения структурных коэффициентов, видно, например, что наибольшая зависимость функций наблюдается от переменной , а функций и - от переменной .

Различные знаки у структурных коэффициентов можно интерпретировать следующим образом. Исходные переменные, имеющие различное направление связи с дискриминантной функцией, т.е. положительные или отрицательные структурные коэффициенты, будут ориентировать объекты в различных направлениях, удаляя или приближая их к центрам соответствующих классов. Из данного примера видно, что переменная X₁ и функция имеют коэффициент -0,036. Это значит, что при увеличении значений функция уменьшается. Допустим, все разности (-) > о ( l= 2, ... , k) для i-го наблюдения, значит его следует отнести к первому классу. Если у классифицируемых объектов значения переменной будут возрастать, то значения функции для этих объектов будут уменьшаться, что приведет к отдалению их от центра первого класса. В конце концов достигнет у p-го объекта «критического» значения, которому будет соответствовать неравенство (-) < 0, т.е. i-й объект уже не попадет в первый класс. Аналогичные рассуждения проводятся и для положительных структурных коэффициентов.

Заключение

Дискриминантный анализ так же, как и кластерный анализ, относится к методам многомерной классификации, но при этом базируется на иных предпосылках. Основное отличие заключается в том, что в ходе дискриминантного анализа новые кластеры не образуются, а формулируется правило, по которому новые единицы совокупности относятся к одному из уже существующих множеств (классов). Основанием для отнесения каждой единицы совокупности к определенному множеству служит величина дискриминантной функции, рассчитанная по соответствующим значениям дискриминантных переменных.

Основными проблемами дискриминантного анализа являются, во-первых, определение набора дискриминантных переменных, Bo-вторых, выбор вида дискриминантной функции. Существуют различные критерии последовательного отбора переменных, позволяющих получить наилучшее различение множеств. Можно также воспользоваться алгоритмом пошагового дискриминантного анализа, который в литературе подробно описан. После уточнения оптимального набора дискриминантных переменных исследователю предстоит решить вопрос о выборе вида дискриминантной функции, Т.е. выбрать вид разделяющей поверхности. Чаще всего на практике применяют линейный дискриминантный анализ. В этом случае дискриминантная функция представляет собой либо прямую, либо плоскость (гиперплоскость).

Линейная дискриминантная функция не всегда подходит в качестве описания разделяющей поверхности между множествами. Например, в тех случаях, когда различаемые множества не являются выпуклыми, правомерно предположить, что дискриминантная функция, приводящая к наименьшим ошибкам классификации, не может быть линейной.

Если множества, используемые в качестве обучающих выборок, близко расположены друг к другу, то возрастает вероятность ошибочной классификации новых объектов, особенно в тех случаях, когда классифицируемый объект сильно удален от центров обоих множеств. Складывается ситуация, при которой распознавание объекта затруднено. Одним из возможных выходов в таком случае является пересмотр набора дискриминантных переменных.

Дискриминантный анализ можно использовать как метод прогнозирования (предсказания) поведения наблюдаемых единиц статистической совокупности на основе имеющихся стереотипов поведения аналогичных объектов, входящих в состав объективно существующих или сформированных по определенному принципу множеств (обучающих выборок).

Список использованной литературы

1. Многомерный статистический анализ в экономике. Под редакцией В.Н. Тамашевича. Москва.1999г.

2. Эконометрика и эконометрическое прогнозирование. Мухамедиев Б.М. Алматы. 2007г.

3. Многомерные статистические методы. Дубров А.М., Мхитарян В.С., Трошин Л.И. Москва. 2003г.

4. Эконометрика. Под редакцией Елисеевой И.И. Москва. 2005г.

5. Эконометрика. Балдин С.В., Быстров О.Ф., Соколов М.М. Москва. 2004г.

Классификация при наличии k обучающих выборок

Раздел: Экономико-математическое моделирование
Количество знаков с пробелами: 21725
Количество таблиц: 3
Количество изображений: 8

Скачать

... , национальные и иные особенности при выходе на зарубежные рынки. При проведении вторичных исследований значимость внутренней или внешней информации определяется в зависимости от целей исследования и объекта исследования. 1.2 Методы обработки маркетинговой информации После того как маркетолог собрал информацию, наступает этап оценки и анализа данных. Прежде чем задействовать сложные методы ...

Скачать

... экспертами, но, как отмечают авторы, для уточнения значений требуется ее дальнейшая производственная проверка. Экспертные системы При наличии разнообразных методов окончательное определение формулировки прогноза лавинной опасности остается за специалистом. Образование, опыт, интуиция, способность оценить неучтенные прогностическими технологиями факторы, выявить ведущий из них на текущий момент ...

Скачать

... практический характер. Результаты, полученные в работе, могут быть использованы в дальнейших исследованиях по управлению риском и могут быть применены в банках. Глава 1. Обзор моделей оценки кредитного риска 1.1. Понятие качества и прозрачности методик Проблема количественной оценки и анализа кредитных рисков и рейтингов заемщиков и создания резервов на случай дефолта является ...

Скачать

... исходить из вида обрабатываемых данных. В соответствии с современными воззрениями делим эконометрику и прикладную статистику на четыре области: - статистика случайных величин (одномерная статистика); - многомерный статистический анализ; - статистика временных рядов и случайных величин; - статистика объектов нечисловой природы. В первой области элемент выборки - число, во второй - вектор, в ...

Главная Новости Рефераты Статьи Вузы

О проекте Соглашение

Наверх

Войти на сайт

Навигация

Похожие работы

0 комментариев

Разделы

Инфо

Следите за новостями