Математическое моделирование
ВВЕДЕНИЕ
Различают четыре типа зависимостей между переменными:
1)Зависимость между неслучайными переменными, не требующую для своего изучения применения статистических методов;
2) 1)Зависимость случайной переменной y от неслучайных переменных, исследуемую методами регрессионного анализа ;
3) 1)Зависимость между случайными переменными y и x i , изучаемую методами корреляционного анализа ;
4) 1)Зависимость между неслучайными переменными, когда все они содержат ошибки измерения, требующую для своего изучения применения конфлюэнтного анализа .
Применение регрессионного анализа для обработки результатов наблюдений позволяет получить оценку влияния переменных, рассматриваемых в качестве аргументов (независимых переменных) на переменную, которая считается зависимой от первых.
Курсовая работа направлена на освоение методов регрессионного анализа в процессе разработки математического описания исследуемого процесса или явления. Курсовая работа предусматривает обработку экспериментальных данных и поиск наиболее удовлетворительной гипотезы взаимосвязи между функцией и аргументами.
В качестве таких гипотез рассматриваются линейная и нелинейная регрессионные модели, каждая из которых может быть парной (только две переменных - функция и аргумент) или множественной (одна функция и несколько аргументов).
Относительно закона изменения независимых переменных x i не делается никаких ограничений –
ЛИНЕЙ Н АЯ ПАРНАЯ РЕГРЕССИЯ
Для нахожден и я т е оретич е ской ли н ии регрессии по данным производственных замеров или специально поставленных экспериментов применяется метод наименьших квадратов , с помощью которого путем определенных вычислений находится уравнение y = f (x), соответствующее взаимосвязи рассматриваемых параметров. А именно, отыскивается теоретическая лин и я регресс и и у по х, занимающая в корреляционном поле тако е положение, при котором выполняется требование, чтобы сумма квадратов расстояний от этой линии до каждой точки в корреляционном поле являлась минимальной.
При изображении корреляционного поля на графике по оси у откладывают значения функции, а по оси х — значения аргумента . Теоретическая линия регрессии у по х должна быть внесена в корреляционное поле таким образом, чтобы соблюдался принцип наименьших квадратов:
m
S 2 = S D y j 2 = S ( y j - y' j ) 2 ( 1 )
j = 1
где j — порядковый номер точки в исходном числовом материале:
у j — измеренное значение функции для определенного значения аргумента ( х );
y' / --расчетное значение функции при заданной величине аргумента ( х
) в соответствии с теоретической их взаимосвязью. В случае линейной зависимости (2)Задача сводится к отысканию коэфф и циентов регрессии а и b уравнения (2), т. е. заранее установлено, что рассматриваемые п араметры у и х связаны линейной зависимостью по уравнению (2).
Величина D y j представляющая собой расстояние от каждой точки корреляционного поля до теоретической линии регрессии, определяется из уравнения
= y j - ( a + b x j ) (3)где x j — параметр х , соответствующий измеренному значению у j .
Для определения численных значений коэффициентов регрессии a и b , исходя из принципа наименьших квадратов отклонений, нужно приравнять нулю частные производные функции S 2 по a и b :
¶ S 2 / ¶ a = ¶ ( S D y j ) 2 / ¶ a = 0, ( 4 )
¶ S 2 / ¶ b = ¶ ( S D y j ) 2 / ¶ b = 0 ( 5 )
Выполнив необходимые преобразования, получим систему двух уравнений с двумя неизвестными для определения a и b :
S y = m a + b S x
S yx = a S x + b S x 2 . ( 6 )
Решая систему уравнений относительно a и b , находим численные знаяения коэффициентов регрессии. Величины S y , S x , S yx , S x 2 находятся непосредственно по данным производственных измерений, которые заданы в курсовой работе.
Величина свободного члена уравнения регрессии (2), или коэффициента а равна функции у при x = 0 .
Коэффици е нт b в уравнении регрессии характеризует изменение функции у при изменении аргумента х на единицу. и графически отражает угол наклона линии уравнения регрессии
При решении практических задач регрессионного анализа возникает вопрос об оценке тесноты исследуемой взаимосвязи, т. е. насколько полученные на основе обработки производственных или лабораторных данных уравнения регрессии достоверны. В случае парной линейной корреляции в качестве оценки тесноты связи используют обычно коэффициент корреляции , который рассчитывается по формуле:
r = ( XY - X * Y ) / ( s x * s y ). ( 7 )
Числитель выражения для коэффициента корреляции r представляет собой разность между средним значением произведения XY и произведением ср е дних значений X * Y измеренных значений параметров x и y исходной информации . Знаменатель равен произведению средних квадратических откло н ений значений параметров у и х от своих средних. Средние квадратические отклонения ( стандартные отклонения ) рассчитываются по формулам:
s
x = { [ S ( x j - X ) 2 ] / m } 1/2 ( 8 )s y = { [ S ( y j - Y ) 2 ] / m } 1/2 . ( 9 )
Квадраты средних квадратических отклонений y и х ( s x 2 и s y 2 ) называются дисперсиями
D x = [ S ( x j - X ) 2 ] / m ( 10 )
D y = [ S ( y j - Y ) 2 ] / m ( 11 )
и являются важными статистическими оценками рассеяния значений какой-либо величины около ее среднего значения.
Величина коэффициента корреляции r может изменяться от 0 при полном отсутствии связи до ± 1 при наличии линейной функциональной связи х с у. Если r > 0 , между х и у имеет место положительная корреляционная связь, т. е. с ростом параметра х увеличивается параметр у , если r < 0 , между х и у имеет место отрицательная связь. С коэффициентом регрессии b в уравнении (2) коэффициент корреляции связан соотношением
r = b s x / s y . (12)Угловой коэффициент р е грессии b представляет собой тангенс угла наклона линии регрессии к оси абсцисс . Следовательно, чем больше наклон линии регрессии к оси абсцисс, тем больше значение коэффициента корреляции, т. е. тем значительнее будет изменение функции у при изменении на единицу аргумента х .
Малая величина коэффициента корреляции указывает на отсутствие линейной связи, однако криволинейная связь между рассматриваемыми параметрами при этом может быть достаточно тесной. Коэффициент корреляции отражает не только величину приращения у при изменении х , но и тесноту связи функции и аргумента. Чем больше разброс точ е к относительно линии регрессии, тем меньше коэффициент корреляции. Это свойство коэффициента корр е ляции отражено в его формуле в виде соотношения стандартных отклонений .
Для оце н ки надежности полученного результата используют иногда критерий надежности m , который уч и тывает как велич и ну коэффициента корреляции, так и число пар измерений. Кр и терий надежности m рассчитывается по формуле
m = r * [ m - 1 ] 1/2 / (1 - r 2 ), (13)
где r — коэффициент корр е ляции;
т — число пар измерений.
Как видно из формулы критерия надежности, чем выше коэффициент корреляции и большее число пар измерений, тем больше показатель надежности. При m , > 2,6 связь считается статист и чески достоверной.
Располагая данными можно выполнить анализ взаимосвязи аргумента и функции : построить график с корреляционным полем рассматриваемых показателей, определить теоретическую линию регрессии, оценить тесноту связи для выбранных параметров. Однако, проанализировав конфигурацию корреляционного поля, построенного по исходным данным, можно усмотреть что описание взаимосвязи рассматриваемых параметров с помощью прямой линии не является наилучшей аппроксимацией. Иногда в данно е поле корреляции значительно лучше впишется некоторая кривая.
Таким образом из технологического опыта может следовать, что связь между аргументом и функцией имеет криволинейный характер. Возможно, что аппроксимация производственных данных в виде кривой точне е отражала бы существующую взаимосвязь.
КРИВОЛИНЕЙНАЯ ПАРНАЯ РЕГРЕССИЯ
Аппроксимация кривой выполняется тем же путем с использованием метода наименьших квадратов, что и выравнивание по прямой линии . Линия регрессии должна удовлетворять условию минимума суммы квадратов расстоян и й до каждой точки корреляцион ного поля. В данном случае в уравнении (1) у представляет собой расчетное значение функции, определенное при помощи уравнения в ыбранной криволинейной связи по фактическим значениям х j . Например, если для аппроксимации связи выбрана парабола второго порядка, то
y
= а + b x + c x 2 , ( 14 ).а разность между точкой, лежащей на кривой, и данной точкой корреляционного поля при соответствующем аргументе можно записать аналогично уравнению (3) в виде
D y j
= y j - ( a + b x + c x 2 ) ( 15 )При этом сумма квадратов расстояний от каждой точки корреляционного поля до новой линии регрессии в случае параболы второго порядка будет иметь вид:
S 2 = S D y j 2 = S [ y j - ( a + b x + c x 2 ) ] 2 ( 16 )
Исходя из условия минимума этой суммы, частные производные S 2 по а , b и с приравниваются к нулю. Выполнив необходимые преобразования, получим систему трех уравнений с тремя неизвестными для определения a, b и с .
S y = m a + b S x + c S x 2S yx = a S x + b S x 2 + c S x 2 .
S yx 2 = a S x 2 + b S x 3 + c S x 4 . ( 17 ) .
Решая систему уравнений относительно a, b и с , находим численные значения коэффициентов регрессии. Величины S y , S x, S x 2 , S yx , S yx 2 , S x 3 , S x 4. находятся непосредственно по данным про и зводственных измерений.
Оценкой тесноты связи при криволинейной зависимости служит теоретическое корреляционно е отношение h xу , представляющее собой корень квадратный из соотношения двух дисперсий: среднего квадрата s р 2 отклонений расчетных значений y' j функции по найденному уравнению регрессии от среднеарифметического значения Y величины y к среднему квадрату отклонений s y 2 фактических значений функции y j от ее среднеарифметического значения :
h xу = { s р 2 / s y 2 } 1/2 = { S ( y' j - Y ) 2 / S ( y j - Y ) 2 } 1/2 ( 18 )
Квадрат корреляционного отношения h xу 2 показывает долю полной изменчивости зависимой переменной у , обусловленную изменчивостью аргумента х . Этот показатель называется коэффициентом детерминации . В отличн о от коэффициента корреляции величина корреляционного отношения может принимать только положительные значения от 0 до 1. При полном отсутствии связи корреляционное отношение равно нулю , при наличии функциональной связ и оно равно единице , а при наличии регрессионной связи различной тесноты корреляционное отношение принимает значения между нулем и единицей. Выбор типа кривой имеет большое значение в регрессионном анализе, поскольку от вида выбранной взаимосвязи зависит точность аппроксимации и статистические оценки тесноты связи. Наиболее простой метод выбора типа кривой состоит в построении корреляционных полей и в подборе соответствующих типов регрессионных уравнений по расположению точек на этих полях. Методы регрессионного анализа позволяют отыскивать численные значения коэффициентов регрессии для сложных видов взаимосвязи параметров, описываемых, например, полиномами высоких степеней. Часто вид кривой может быть определен на основе физической сущности рассматриваемого процесса или явления. Полиномы высоких степеней имеет смысл применять для описания быстро меняющихся процессов в том случае, если пределы колебания параметров этих процессов значительные.
Применительно к исследованиям металлургического процесса достаточно использовать кривы е низших порядков, например параболу второго порядка.
Эта кривая может иметь один экстремум, что, как показала практика, вполне достаточно для описания различных характеристик металлургического процесса.
Результаты расчетов параметров парной корреля ц ионной вза и мосвязи были бы достоверны н представляли бы практическую цен н ость в том случае, если бы и спользуемая информация была получена для условий широких пределов колебаний аргумента при постоянстве всех прочих параметров процесса. Следовательно, методы исследования парной корреляционной взаимосвязи параметров могут быть использованы для решения практических задач лишь тогда, когда существует уверенность в отсутств и и других серьезных влияний на функцию, кроме анализируемого аргумента. В производственных условиях вести процесс таким образом продолжительное время невозможно. Однако если иметь информ а цию об основных параметрах процесса, влияющих на его результаты, то математическим путем можно исключить влияние этих параметров и выделить в “чистом виде” взаимосвязь интересующей нас функции и аргумента. Такая связь называется частной, или индивидуальной. Для ее определения используется м е тод множественной регрессии.
МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ
Множественной регрессией называется взаимосвязь трех и более переменных, или влияни е двух и более аргументов на функцию
( x 1 , x 2 , .... x n ) . ( 19 )Для простоты рассмотрим случай, когда функция у сопоставляется с двумя аргументами x 1 и x 2 . Такую зависимость графически можно представить в трехмерн о м пространстве { у , x 1 , x 2 } Со вокупность всех т точек пред ставляет собой корреляционное пространство. Задача определения связи у от x 1 и x 2 со стоит в том, чтобы подобрать такую плоскость, например плоскость Р , которая наилучшим образом вписалась бы в данное корреляционное пространство:
y = a + b
1 x 1 + b 2 x 2 . ( 20 )При этом под словами “наилучшим образом” понимается удовлетворение требованию наименьших квадратов, т. е. сумма квадратов расстояний каждой точки корреляционного поля от искомой плоскости [уравнение y = a + b 1 x 1 + b 2 x 2 ] должна быть минимальной. Это расстоян и е определяется выражением
= y j - ( a + b 1 x 1 + b 2 x 2 ) ( 21 )
Требуется найти значения коэффициентов a , b 1 и b 2 .
Выполнив необходимые преобразования, получим систему трех уравнений с тремя неизвестными:
, S y = m a + b 1 S x 1 + b 2 S x 2
S yx 1 = a S x 1 + b 1 S x 1 2 + b 2 S x 1 x 2 .
S yx 2 = a S x 2 + b 1 S x 1 x 2 + b 2 S x 2 2 . ( 22 )
Решение системы уравнений относительно коэффициентов a , b 1 и b 2 , позволяет определить их численные значения. Величины S y , S x 1 , S x 1 2 , S yx 1 , S y x 2 , S x 2 , S x 2 2 , S x 1 x 2 . находятся непосредственно по данным производственных измерений.
Таким образом, найденное уравнение регрессии описывает совместное влияние x 1 и x 2 на функцию у . Коэффициенты a , b 1 и b 2 при этом имеют математический смысл.
Коэффициент а равен функции у при нулевых значениях аргументов x 1 и x 2 . В геометрической интерпретации коэффициент а соответствует ординате точки пересечения плоскости регрессии Р с осью y .
Коэффициент b 1 равен изме н ению функции у при изменении первого аргумента х 1 на единицу при неизменном втором аргументе x 2 . Аналогично коэффициент регрессии b 2 равен изменению функции у при изменении второго аргумента x 2 на единицу при неизменном первом аргументе x 1 .
Из уравнения множественной линейной регрессии могут быть получены уравн е ния частной регрессии аргументов x 1 и x 2 на функцию у :
у = a ' 1 + b 1 х 1
( 23 a )у = a ' 2 + b 2 х 2
( 23 b )При этом угловые коэффициенты регрессии b 1 и b 2 сохраняют те же числовые значения, что и в уравнении множественной регрес сии. Свободные члены уравнений для y можно подсчитать следующим образом:
a
' 1 = а + b 2 X 2 , ( 24 a )a ' 2 = а + b 1 X 1 , ( 24 b )
гд е а — свободный член в уравнении множественной регрес сии ;
X 1 , X 2
— средние значения соответствующих аргументов. х \ .Закономерности и выводы, используемые при исследовании взаимосвязи трех переменных (в трехмерном пространстве), применимы и для взаимосвязи большего числа переменных, .т. е. для многомерного пространства типа
y= f ( x 1 , x 2 , .... x n ) ( 25 )
В этом случае расчет уравнения множественной линейной регрессии типа
y = a + b
1 x 1 + b 2 x 2 + . b 3 x 3 + + b n x n ( 26 )ведется для определения коэффициентов a , b 1 , b 2 , b n .
Чтобы определить численные значен и я этих в е личин, необходимо решить систему уравн е ний: аналогичную приведенной выше для двух аргументов и функции.
Определив коэффициенты регрессии решением системы уравнений , получим уравнение множественной линейной регрессии , из которого могут быть получены уравнения частной взаимосвязи функции с каждым аргументом:
у = a'
i + b i х i , (27)где a ' i — свободный член частного уравнения регрессии;
i - порядковый номер анализируемого аргумента.
Так же как и в случае трехмерной задачи, угловой коэффициент регрессии b i сохраняет то же численное значение, что и в уравнении множественной линейной регрессии . Свободный член частного уравнения регрессии рассчитывается по формуле
n
a' i = а + S b i X i - b e X e ( 28 )
i = 1
где а — свободный член множественного линейного уравнения регрессии;
X
i — средние значения аргументов;X
e —среднее значение одного из -аргументов.Оценкой тесноты связи при множественной линейной регрессии служит коэффициент множественной корреляции R , определяемый по формуле:
{ b 1 [ s x 1 / s y ] r yx 1 + ... + b n [ s x n / s y ] r yx n } 1/2 ( 29 )Величина коэффициента мн о жественной корреляции всегда положительна и может меняться от 0 (при отсутствии связи) до 1 (при функциональной связи). С помощью коэффициента множественной корреляции оценивают совместное влияние на зависимую переменную всех включенных в расчет аргументов. Квадрат величины коэффициента множественной корреляции показывает долю изменчивости зависимой переменной, обусловлен н ую изменением всех рассматриваемых аргументов, и называется коэффициентом множественной детерминации .
Для оценки тесноты частной взаимосвязи функци и и каждого а ргумента служит коэффициент частной корреляции . Этот статисти ч еск и й показатель учитывает тесноту взаимосвязи функции и одно г о из показателей-аргументов при условии, что остальные аргументы з акреплены на уровне своих средних значений и не влияют на функ ц ию. Коэффициент частной корреляции обозначается индексом r y x i , где i — порядковый номер оцениваемого аргумента) и рассчиты в ается по формуле
{ 1 - R 2 n } } 1/2
r yx i = { 1 - ---------------- } ( 30 )
{ 1 - R 2 n - 1 }
R 2 n — квадрат коэффициента множественной корреляции для п аргументов ;R 2 n - 1 —- квадрат коэффици ен та множественной кор реляц и и для n— 1 аргументов без i- того^. К а к видно из формулы ( 30 ), коэффициент частной корреляции позволяет выделить уменьшение изменчивости фактических значений функции вокруг расчетных, связанное с введением в расчет уравнения множеств е нной регрессии i -того аргумента. Коэффиц и ент r yx i прин и мает значения от 0 ( при отсутствии связи) до 1 ( п ри наличии функциональной св язи). Из формулы (30 ) н евозм ожно опр е делит ь знак коэффициента частной корреляции, поэтому его определяют по знаку углового коэффициента регрессии b i для данного аргумента. Значение коэффициента частной корреляции может отличаться от коэффициента парной корреляции не только по величине, но и по знаку для одной и той же задачи. При этом нужно помнить, что коэффициент частной корреляции является более об ъ ективной оценкой действительной взаимосвязи.
Оценка тесноты и ндивидуальной связи функции и аргумента при множественной регресс и и с помощью коэффициента частной корреляции является боле е достоверной. Это соображение подтверждается уменьшением рассеяния точек относ и тельно л и ни и частной регрессии по сравнению с линией парной регрессии. Следовательно, даже при уменьшении коэффициента частной корреляции по сравнению с парным при частной регрессии наблюдается более тесная связь м е жду функцией и аргументом.
Для расчета по формуле (30) необходимо рассчитать коэффициенты регрессии с помощью систем уравнений отдельно для п и п— 1 аргументов. При этом значения коэффициентов будут различными.
Итак, в результате решения уравнения множественной регрессии , можно найти численные значения коэффициентов а , b 1 , b 2 , b 3 , ..., b п . , определить показател и тесноты связи, а и менно коэффициент множественной корреляции R , коэффициент детерминации , коэффициенты частной корреляции r' ух i .
Несмотря на то что уравнения частной линейной регрессии характеризуют реальную взаимосвязь функции и i -того аргумента с большей достоверностью, чем уравнения парной регрессии, они во многих случаях не удовлетворяют исследователей. Недостаток уравнений частной линейной регрессии заключается в том, что анализируемая зависимость представляется в виде прямой. В действительности, большинство взаимосвязей параметров металлургических процессов им е ет криволинейный характер. Любое техническое мероприяти е тем эффективней, чем хуже абсолютные исходные показатели.
Для повышения достоверности взаимосвязей параметров технологического процесса необходимо определить уравнения частной криволинейной регрессии. Рассмотрим несколько способов такого определения.
ЧАСТНАЯ КРИВОЛИНЕЙНАЯ РЕГРЕССИЯ НА ОСНОВЕ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ
Для упрощения рассмотрим задачу, в которой фигурируют два аргумента ( x 1 и x 2 ) и функция у . Рассчитаем уравнение м ножественной линейной регресс и и, т. е. определим численные значения коэффициентов а , b 1 и b 2
Найдем уравнения частной криволинейной регрессии. Например, чтобы получить уравнение частной регрессии у по x 2 , нужно исключить влияние на у аргумента x 1 . Для этого можно использовать следующий прием: каждое значение функции у в таблице исходной информации нужно скорректировать на величину отклонения первого аргумента от своего среднего, пользуясь для этого найденным угловым коэффициентом регрессии b i. Тогда каждое скорректированное значение функции у' будет равно:
y' j = y j - ( x 1j - X j ) b 1
, ( 31 )где y j — значение функции в таблице исходной информац и и
1j —значение первого аргумента в таблице исходной информации;X
j - среднее значение первого аргументаТаким образом, скорректированное значение функции представляет собой фактическое значение функции скорректированное на влияние первого аргумента. В результате получаем ряд скорректированных значений функции, который не имеет регрессионной связи с рядом значений первого аргумента (коэффициент корреляции между скорректированной функцией и первым аргументом равен нулю).
Если в задаче имеется, например, п аргументов, то корректировка исходных значений функции должна быть выполнена по всем аргументам, кроме одного, частную связь которого с функцией предполагается определить. Для этого скорректированные значения функции у по всем аргументам, кроме второго, можно рассчитать по уравнению:
y'
j = y j - ( x 1 j - X 1j ) b 1 - ( x 3 j - X j ) b 3 - ( x n j - X n ) b n ( 32 )угловой коэффиц и ент регр е сс ии из Таким:
^ == 523 , 0— 0,00493 Шл + 0,0001155 Шл".
. Расчет парной криволинейной связи между у' j и х 2j может быть выполнен по методике, рассмотренной выше с использованием метода наименьших квадратов. Например, если для аппроксимации связи выбрана парабола второго порядка, то уравнение частной криволинейной регрессии следующее
у** j
= а ** + b ** 2 x 2 + c ** 2 x 2 2 ( 33) .а разность между точкой, лежащей на кривой, и данной точкой корреляционного поля
D y j
= y' j - у** j = y' j - ( а ** + b ** 2 x 2 + c ** 2 x 2 2 ) (34 )При этом сумма квадратов расстояний от каждой точки корреляционного поля до новой линии регрессии в случае параболы второго порядка будет иметь вид:
S 2 = S D y j 2 = S [ y' j - ( а** + b** 2 x 2 + c** 2 x 2 2 ) ] 2 ( 35 )
Исходя из условия минимума этой суммы, частные производные S 2 по а**, b** 2 и с** 2 приравниваются к нулю. Выполнив необходимые преобразования, получим систему трех уравнений с тремя неизвестными для определения a**, b** и с**.
, S y' = m a ** + b ** 2 S x 2 + c ** 2 S x 2 2
S y'x 2 = a** S x 2 + b** 2 S x 2 2 + c** 2 S x 2 3
S y'x 2 2 = a ** S x 2 2 + b ** 2 S x 2 3 + c ** 2 S x 2 4. ( 36 )
Решая систему уравнений (36) относительно a **, b ** 2 и с ** 2 , находим численные значения коэффициентов регрессии
Определяется парное корреляционное отношение для связи между скорректированными значениями функции у' и соответствующим аргументом x i . Парное корреляционное отношение является частным корреляционным отношением для связи между фактическими исходными значениями функции у и соответствующим аргументом к. В отличие от парного частное корреляционное отношение будем обозначать индексом h ** уx i , где i— -порядковый номер аргумента, теснота связи с которым оценивается данным корреляционным отношением. Значение частного корреляционного отношения то же, что и коэффициента частной корреляции в случае множественной линейной корреляции.
Частное корреляционное отношение h ** уx i :, определяется аналогично парному корреляционному отношению.
h ** уx i = { S ( y** j - Y ) 2 / S ( y' j - Y ) 2 } 1/2 ( 37 )
Аналогичным путем рассчитываются частные в заимосвязи фу н кции со всеми остальными аргументами.
Рассмотрим еще одну методику определения частн ой криво линейной регрессии, котор а я лишена этого недостатка.
ЧАСТНАЯ КРИВОЛИНЕЙНАЯ РЕГРЕССИЯ НА ОСНОВЕ МНОЖЕСТВЕННОЙ НЕЛИНЕЙНОЙ РЕГРЕССИИ
Для определения уравнения множественной криволинейной регрессии также используется метод наименьших квадратов.
Рассмотрим случай, когда функция зависит от двух аргументов ( x 1 и x 2 ) аналогично примеру, рассмотренному при oписании множественной линейной корреляции. В сист е ме координат у— X 1 — Х 2 располагается некое корреляционное пространство, образованное множ е ством точек , каждая из которых соответствует результатам измерения параметров процесса. Задача состоит в том, чтобы вписать в д анное корреляционное пространство некую поверхность, которая удовлетворяла бы условию наименьших квадратов отклонений. Условию на и меньших квадратов удовлетворяет поверхность для которой сумма квадратов расстояний до точек корреляционного поля минимальна:
Уравнение такой поверхности наилучшим образом опи ше т взаимосвязь у , X 1 и Х 2 .
y = a + b 1 x 1 + c 1 x 1 2 + b 2 x 2 + c 2 x 2 2 .
( 38 ) ,Для определения коэффициентов такого уравнения используем систему пяти уравнений с пятью неизвестными.
S y = m a + b 1 S x 1 + с 1 S x 1 2 + b 2 S x 2 + с 2 S x 2 2
S yx 1 = a S x 1 + b 1 S x 1 2 + с 1 S x 1 3 + b 2 S x 1 x 2 + с 2 S x 2 2 x 1
S yx 1 2 = a S x 1 2 + b 1 S x 1 3 + с 1 S x 1 4 + b 2 S x 2 . x 1 2 + с 2 S x 2 2 x 1 2
S yx 2 = a S x 2 + b 1 S x 1 x 2 + с 1 S x 1 2 x 2 + b 2 S x 2 2 + с 2 S x 2 3
S yx 2 2 = a S x 2 2 + b 1 S x 1 x 2 2 + с 1 S x 1 2 x 2 2 + b 2 S x 2 3 . + с 2 S x 2 4 (39)
Есл и все точки корреляционного пространства находятся на расчетной поверхности, то множественное корреляционное отношение будет равно единице. При этом связь между функцией у и аргументами x 1 и x 2 будет функциональной. По мере удаления точ е к от расчетной поверхности этот показатель будет уменьшаться, приближаясь к нулю.
При переходе к анализу криволинейных связей возникает проблема выбора типа кр и вой, с помощью которой выполняется аппроксимация каждой пары рассматриваемых пер е менных. Для монотонно меняющегося процесса в сравнительно небольших интервалах изменения параметров, каким является металлургический процесс, можно без значительной ошибки аппроксимировать все существующие связи Xi— Хе и у—Xi с помощью полиномов второй степ е ни. Такое допущение намного упрощает методику расчета, , но в то же время сохраняет рассмотренные выше преимущества, присущие криволинейной аппроксимации. На основе сделанного допущения можно рассчитать уравнение множеств е нной кривол и нейной регрессии вида:
y = a + S b i x i + S c i x i 2
( 40 )где b и c — коэффициенты регрессии п ри i-том аргументе ( 1 = 1, 2 , . .., п );
n —число аргументов в регрессионной модели;
а— свободный член уравнения регрессии.
Коэффициенты а , b и c , так же как и прежде, находятся методом наименьших квадратов из системы уравнений, которая в данном случае будет большей по сравнению с системой для определения коэффициентов множественной линейной регрессии. Количество неизвестных ( а , b и c ), равное числу уравнений в случае множественной криволинейной регрессии, составит z = 2 n + 1, где п — число аргументов в корреляционной модели. Таким образом, если для определения уравнения множественной линейной корреляции с десятью аргументами необходимо решить систему из 11 уравнений с 11 неизвестными { а и 10 x ) , то для нахождения уравнения с десятью аргументами необходимо решить систему из 21 уравнения с 21 неизвестным .
Частное уравнение регр е ссии в этом случае имеет вид
уx i
= а ' + b i x i + c i x i 2 , (41) .причем свободный член этого уравнения а ' для каждой связи у— x i имеет свое численное значение, отличное от свободного члена а в уравнении множественной регрессии ( ), ( ), а значения коэффициенты регрессии b i и c i те же. Свободный член частного уравнения регрессии в данном случае рассчитывается по формуле
a
' i = a + S b 1- ( n - i ) X 1- ( n - i ) + S c 1- ( n - i ) X 2 1- ( n - i ) ( 42 )где a — свободный член уравнения множественной регрессии.
Второй чле н правой части уравнения представляет собой сумму произведений средних значен и й каждого аргумента, кроме 1 -того, на его коэффициент регрессии b i , а третий член правой части уравнения представляет собой сумму про и зведен и й квадратов средних значений каждого аргумента, кроме t -того, на его коэффициент регрессии c i. Коэффициенты регрессии b и c взяты из уравнения множественной регрессии . Таким образом, из уравнения множественной регрессии может быть получен ряд уравнений частной регрессии (по числу аргументов п в корреляционной модели), с помощью которых определяются характер индивидуальных взаимосвязей функции и каждого аргумента.
Оценкой тесноты частной корреляционной связи в данном случае служит частное корреляционное отношение. Этот показатель рассчитывается аналогично парному корреляционному отношению .
ЗАДАНИЕ НА ВЫПОЛНЕНИЕ КУРСОВОЙ РАБОТЫ
Задание на выполнение курсовой работы состоит из краткого текста, поясняющего существо приводимых в задании групп исходных данных и самих групп исходных данных. Среди этих данных имеется несколько аргументов и одна функция. В задача курсовой работы входит проверка гипотез возможных связей между аргументами и функцией. Критерием правильности одной из гипотез является показатель тесноты связи. Это либо коэффициент парной или частной корреляции, либо парное или частное корреляционное отношение. После статистической обработки исходных данных проводится сравнение полученных показателей и делаются выводы о правомерности одного из предположений о характере связей.
СОСТАВ, ОБЪЕМ И СОДЕРЖАНИЕ КУРСОВОЙ РАБОТЫ
Курсовая работа включает теоретическую часть, в которой приводится описание методов регрессионного анализа, применяемых в данной работе.
Следующий раздел предусматривает предварительную статистическую обработку данных для их последующего рационального использования. Автор работы указывает на необходимость вычисления средних значений аргументов, средних квадратов аргументов, средних значений третьей и четвертой степени и т.д., после чего составляется таблица обработки исходных данных. Вид таблицы приведен ниже.
NN x 1 x 1 2 x 1 3 x 1 4 x 2 x 2 2 x 2 3 x 2 4 y yx 1 yx 2 yx 1 2 yx 2 2
--------------------------------------------------------------------------------------
...... ..... .... ..... ..... ...... ..... ..... ..... ..... ...... ...... ......
----------------------------------------------------------------------------------------------------------------
Средние
значения X 1 X 1 2 X 1 3 X 1 4 X 2 X 2 2 X 2 3 X 2 4 Y YX 1 YX 2 YX 1 2 YX 2 2
Правильно составленная таблица позволяет легче справляться с вычмслением различнхы ситуаций в процессе решения разделов регрессионного анализа.
ОФОРМЛЕНИЕ КУРСОВОЙ РАБОТЫ
Курсовая работа офрмляется следующим образом.
- Титульный лист с указанием фамилии , имени, отчества студента и фамилии преподавателя
- Оригинал задания на выполнение курсовой работы
- Аннотация курсовой работы
- Оглавление работы
Теоретическая часть
Практическая часть работы
Выводы
Список использованной литературы
Приложения
ЗАШИТА КУРСОВОЙ РАБОТЫ
Защита курсовой работы происходит перед комиссией, составленной из преподавателей кафедры. Студент в течение 5-8 минут докладывает основное содержание работы, ее резулььаты и выводы, отвечает на вопросы членов комиссии. Оценка курсовой работы производится членами комиссии по пятибалльной системе с учетом содержания работы и ответа на вопросы.