1. Элементы вариационного исчисления
1.1 Понятие функционала и оператораВ курсе высшей математики вводилось понятие функции. Если некоторому числу x из области D ставится в соответствие по определенному правилу или закону число y, то говорят, что задана функция y = f(x). Область D называют областью определения функции f(x).
Если же функции y(x) ставится в соответствие по определенному правилу или закону число J, то говорят, что задан функционал J = J(y). Примером функционала может быть определенный интеграл от функции y(x) или от некоторого выражения, зависящего от y(x),
Если теперь функции y(x) ставится в соответствие по определенному правилу или закону вновь функция z(x), то говорят, что задан оператор z = L(y), или z = Ly.
Примерами дифференциальных операторов могут служить:
Дадим более строгое определение функционала. Пусть A – множество элементов произвольной природы, и пусть каждому элементу u є A приведено в соответствие одно и только одно число J(u). В этом случае говорят, что на множестве A задан функционал J. Множество A называется областью определения функционала J и обозначается через D(J); число J(u) называется значением функционала J на элементе u. Функционал J называется вещественным, если все его значения вещественны. Функционал J называется линейным, если его область определения есть линейное множество и если
J (αu + βv) = αJ(u) + βJ(v).
1.2 Задачи, приводящие к экстремуму функционала Рис. 1.1 |
Зарождение вариационного исчисления относят обычно к 1696 г., когда И. Бернулли поставил так называемую задачу о брахистохроне: точки А (0,0) и В (а, b) расположены в вертикальной плоскости (xy) (рис. 1). Какова должна быть кривая, лежащая в плоскости (xy) и соединяющая точки А и В, чтобы материальная точка, двигаясь без трения, скатывалась по этой кривой из точки А в точку В в кратчайшее время?
Искомая кривая и была названа брахистохроной.
Пусть уравнение кривой АВ есть y = u(x). Рассмотрим некоторый момент времени t, и пусть в этот момент движущаяся точка находится на расстоянии y от оси x. Тогда , где v – скорость движущейся точки, g – ускорение силы тяжести. В то же время
Отсюда
.
Обозначим через Т время, в течение которого материальная точка достигает точки В. Интегрируя, находим
(1.1)
Задача сводится к следующему: надо найти функцию y = u(x), удовлетворяющую условию
u(0) = 0; u(а) = b (1.2)
и сообщающую интегралу (1.1) наименьшее значение. Условия (1.2) означают, что искомая кривая должна проходить через заданные точки А и В. Такого типа условия принято называть граничными, или краевыми, так как они относятся к концам промежутка, на котором должна быть определена искомая функция.
Примером применения кривой в виде брахистохроны служит образующая цилиндрических поверхностей, используемых на детских площадках, в аттракционах для спуска с возвышения, на трамплинах.
Задача о наибольшей площадиСформулируем эту задачу так: среди всех плоских кривых, имеющих данную длину и оканчивающихся в точках А (а, 0) и В (b, 0), найти кривую, ограничивающую вместе с отрезком [а, b] оси x область с наибольшей площадью.
Пусть уравнение кривой будет y = u(x). Задача заключается в том, чтобы найти функцию u(x), удовлетворяющую краевым условиям
u(а) = u(b) = 0 (1.3)
и тождеству
(1.4)
и сообщающую интегралу
(1.5)
наибольшее значение.
Общим для рассмотренных задач является то, что каждый раз ищется функция, удовлетворяющая тем или иным поставленным условиям и сообщающая экстремальное значение заданному функционалу.
Приведенные здесь задачи относятся к ветви математического анализа, называемой вариационным исчислением.
Задача вариационного исчисления состоит в следующем: дан функционал J с областью определения D(J); требуется найти элемент u0 є D(J), сообщающий функционалу либо минимальное значение
, (1.6)
либо максимальное значение
. (1.7)
Задача о максимуме функционала J тождественна с задачей о минимуме функционала – J, поэтому в дальнейшем будем рассматривать только задачу о минимуме функционала J.
В приведенной общей формулировке задачу вариационного исчисления решить вряд ли возможно, поэтому наложим на функционал J некоторые ограничения.
Будем считать, что D(J) есть часть некоторого пространства Х. Чтобы сформулировать дальнейшие ограничения, введем понятие линейного многообразия. Пусть М – линейное множество элементов пространства Х и ū – некоторый фиксированный элемент этого пространства. Линейным многообразием в пространстве Х назовем совокупность элементов, каждый из которых можно представить в виде
u = ū + η, ηєМ. (1.8)
Если ūєМ, то, очевидно, так определенное линейное многообразие совпадает с М.
Требование 1. Область определения D(J) функционала J есть линейное многообразие.
Будем считать также, что пространство Х бесконечномерно. Тогда в Х линейное множество М также бесконечномерно и, следовательно, из него можно выделить конечномерное подпространство.
Требование 2. Если η пробегает любое конечномерное подпространство, содержащееся в М, то на этом подпространстве функционал J(u) = J (ū + η) непрерывно дифференцируем достаточное число раз.
Введем понятие об абсолютном и относительном минимуме функционала. Функционал J достигает на элементе u0 є D(J) абсолютного минимума, если неравенство
J(u0) = J(u) (1.9)
Справедливо для любого элемента u є D(J). Тот же функционал достигает на элементе u0 относительного минимума, если неравенство (9) справедливо для элементов u є D(J), достаточно близких к u0.
Абсолютный минимум называют еще сильным минимумом, а относительный – слабым.
Существует аналогия между нахождением минимума функции и минимума функционала. При нахождении минимума функции первая производная функции приравнивается к нулю и находится точка, подозрительная на экстремум. Затем с помощью второй производной проверяется достаточное условие экстремума. При нахождении минимума функционала находится первая вариация функционала и приравнивается к нулю. В результате получаем необходимое условие экстремума функционала. Для проверки достаточного условия экстремума функционала находится вторая вариация функционала.
1.4 Первая вариация и градиент функционалаБудем рассматривать функционал J, подчиненный требованиям 1, 2. Возьмем произвольный элемент u є D(J) и произвольный элемент η є М. Обозначим через α произвольное вещественное число. Нетрудно видеть, что элемент
u + αη є D(J). (1.10)
Составим выражение J (u + αη). В силу требования 2 J (u + αη) есть непрерывно дифференцируемая функция от α. Вычислим ее производную и возьмем значение этой производной при α = 0
. (1.11)
В результате получим число, которое можно рассматривать как значение функционала (11), зависящего от двух элементов u и η.
Определение. Функционал
называется первой вариацией функционала J на элементе u и обозначается символом δJ (u, η):
. (1.12)
При этом разность двух функций u є D(J) и u1 є D(J) называют вариацией функции u и обозначают δu = u(х) – u1 (х).
Пример. Найти первую вариацию функционала
(1.13)
область определения которого D(J) состоит из функций, удовлетворяющих следующим условиям: uС(1) [a, b] и
u(а) = А, u(b) = В, (1.14)
где А и В-заданные постоянные. Условия (14) означают, что кривые у = u(х), где uD(J), проходят через две фиксированные точки (а, А) и (b, В).
Несложно показать, что функционал (13) удовлетворяет оговоренным выше двум требованиям, кроме того, он удовлетворяет требованию 3.
Требование 3. Вариация δJ (u, η) – не только однородный, но и аддитивный функционал от η.
Составим вариацию функционала (1.13)
(1.15)
Можно показать, что интеграл:
(1.16)
есть ограниченный функционал от η, при этом считаем, что η(х) непрерывно дифференцируема и удовлетворяет условиям:
η(а) = η(b) = 0. (1.17)
В этом случае интеграл (1.16) можно взять по частям
Таким образом, интеграл (1.15) можно записать в виде
. (1.18)
Здесь u + αη – u = αη = δu u можно записать
(1.19)
Вариацию δJ (u, η) можно записать в виде
δJ (u, η) = (Рu, η). (1.20)
Определение. Оператор Р, определенный формулой (1.20), называется градиентом функционала J(u) и обозначается символом
Р = grad J.
Если uD(Р), то вариацию функционала J(u) можно записать в виде
δJ (u, η) = (grad J(u), η) (1.21)
Здесь взяли α = 1, чтобы не загромождать запись. В выражении (1.18)
.
1.5 Необходимое условие минимума функционалаПусть функционал J достигает на некотором элементе u0 относительного минимума. Возьмем произвольный элемент ηМ и произвольное вещественное число α. По определению относительного минимума при достаточно малых значениях α
J(u0 + αη)J(u0) (1.22)
Это неравенство означает, что функция одной вещественной переменной α, равная J(u0 + αη), имеет при α0 = 0 относительный минимум. Но тогда необходимо
или, что то же
δJ(u0, η) = 0 (1.23)
Если функционал в некоторой точке достигает минимума, то в этой точке первая вариация функционала равна нулю. В этом заключается необходимое условие экстремума функционала.
1.6 Уравнение Эйлера. Связь между вариационной и краевой задачамиРассмотрим основную лемму вариационного исчисления.
Лемма Лагранжа.
Пусть f (х, у) – функция, непрерывная в области D с контуром Г. Если
η (х, у) dxdy = 0 (1.24)
для любой функции η (х, у), непрерывной в области D вместе со своими частнымы производными до n-го порядка включительно и обращающейся в нуль на границе Г (η (х, у)|Г = 0), то
f (х, у) = 0.
Для примера, рассмотренного в 1.4, было получено в точке минимума функционала (1.13) условие
(1.25)
Исходя из леммы Лагранжа, можем записать
. (1.26)
Если условие (1.25) записать в виде
,
то очевидно, что δu (вариация искомой функции) – функция неравная нулю на отрезке (а, b), поэтому должно выполняться условие (1.26).
Уравнение (1.26) можно еще записать в виде
Уравнение (1.26) называют уравнением Эйлера. Если предположить существование непрерывной второй производной от u(х), то уравнение (1.26) можно записать в виде
.
Таким образом, условие минимума функционала (1.13) при условии (1.14) приводит к краевой задаче для уравнения Эйлера (1.26) при тех же условиях (1.14), т.е. Существует тесная связь между вариационной задачей о минимуме функционала и краевой задачей для уравнения Эйлера для этого функционала.
Решения уравнения Эйлера (1.26), удовлетворяющие условиям (1.14) называют экстремалями функционала (1.13).
1.7 Пути решения вариационных задачОдин из путей решения вариационной задачи, т.е. задачи нахождения минимума некоторого функционала J(u) при заданных краевых условиях, состоит в сведении этой задачи к краевой задаче для дифференциального уравнения при тех же краевых условиях, которое является уравнением Эйлера для этого функционала, с последующим решением этой задачи.
Второй путь решения вариационной задачи состоит в применении вариационных методов, которые позволяют приближенно найти функцию u0, дающую минимум функционалу J(u), и удовлетворяющую заданным краевым условиям.
Рассмотрим несколько примеров решения задач вариационного исчисления, основанных на нахождении уравнений Эйлера с последующим их решением.
Пример 1.
Найти функцию у = u(х), удовлетворяющую условию
u(0) = u(1) = 0 (1.27)
и дающую минимум функционалу
(1.28)
Будем считать, что функция u(х) непрерывна и имеет непрерывные производные до второго порядка включительно.
Уравнение Эйлера для функционала (28) будет иметь вид
(1.29)
Таким образом, получили краевую задачу для линейного дифференциального уравнения второго порядка с постоянными коэффициентами. Общее решение уравнения (1.29) будет иметь вид
.
Для нахождения произвольных постоянных с1 и с2 воспользуемся краевыми условиями (1.27). В результате получим
Откуда
Следовательно, функция, дающая минимум функционалу (1.28) при условии (1.27), будет иметь вид
. (1.30)
Пример 2.
В качестве второго примера рассмотрим задачу о брахистохроне.
Как было показано ранее (см. 1.2.1), задача состоит в том, чтобы найти функцию у = u(х), удовлетворяющую условиям:
u(0) = 0, u(а) = b
и сообщающую минимум функционалу
.
В этом случае
. (1.31)
Функция (31) при u = 0 терпит разрыв. Путем несложных рассуждений показывается, что все-таки можно воспользоваться уравнением Эйлера в виде (1.26).
Уравнение (1.26) приводится к виду
(1.32)
Отсюда
.
Положим . Тогда .
Дифференцируя это выражение, получим . Замена дает дифференциальное уравнение относительно
Далее
.
Положив , получим
.
Таким образом, если решение задачи о брахистохроне имеет решение, то это решение есть циклоида.
1.8 Вторая вариация функционала. Достаточное условие минимума функционалаРассмотрим функцию от вещественной переменной , считая и фиксированными.
Эту функцию разложим в ряд Тейлора:
(1.34)
где R1 – остаточный член ряда.
Выражение
называется второй вариацией функционала J на элементе u.
Разложение (1.34) можно записать в виде
. (1.36)
Пусть функционал J достигает минимума, относительного или абсолютного на элементе u0. Тогда , и формула (1.36) дает
. (1.37)
Из этого соотношения вытекает достаточное условие того, что элемент u0, удовлетворяющий уравнению Эйлера (экстремаль), сообщает функционалу минимальное значение. Для абсолютного минимума это условие имеет вид (учитывая, что
(1.38)
для относительного минимума оно состоит в том, что неравенство (1.38) выполняется, когда элемент достаточно мал по норме.
Условие (1.38) в конкретных задачах трудно проверить, потому что величина обычно неизвестна, и непосредственно им, как правило, воспользоваться не удается.
Поэтому для проверки достаточного условия экстремума функционала пользуются более простыми условиями.
Запишем вторую вариацию для функционала (1.13)
пользуясь определением второй вариации (1.35)
,
где .
Так как , то, предполагая наличие соответствующих производных у Ф, интегрируя по частям и принимая во внимание, что , получим
, (1.39)
где .
Считаем, что необходимое условие экстремума выполнено, т.е. и для определенности будем говорить о минимуме функционала (1.13). Функция , как функция переменной при должна иметь минимум, следовательно, необходимым условием минимума является тот факт, чтобы при любом выборе . Можно показать, что отсюда непосредственно вытекает, что вдоль экстремали должно иметь место равенство .
Условие
называют условием Лежандра.
Более сильное условие
называют усиленным условием Лежандра.
Рассмотрим интеграл, входящий в формулу (1.39), заменяя букву буквой , получим
.
Уравнение Эйлера для этого интеграла будет иметь вид
, (1.40)
причем, в этом уравнении есть коэффициент при и в силу условия , деля обе части уравнения на R, получим уравнение вида
с непрерывными в [a, b] коэффициентами p(x) и q(x). Уравнение (1.40) называют уравнением Якоби.
Пусть - решение уравнения (1.40), удовлетворяющее начальным условиям
.
Существенным для дальнейшего будет тот факт, имеет ли решение корни внутри промежутка [a, b]. Оказывается, что если такие корни имеются, то исследуемая экстремаль не может давать минимум функционалу (1.13).
Если при a < x < b, то говорят, что экстремаль u(x) в промежутке (a, b) удовлетворяет условию Якоби, а если при , то говорят, что экстремаль u(x) удовлетворяет усиленному условию Якоби. Следует заметить, что коэффициенты S и R уравнения (1.40) зависят от экстремали u(x) и, следовательно, высказанные выше условия являются условиями, накладываемыми на экстремаль u(x).
Имеет место следующая теорема. Усиленные условия Лежандра и Якоби достаточны для того, чтобы экстремаль давала слабый (местный) экстремум функционалу (1.13).
Можно показать, что если выполнены усиленные условия Лежандра и Якоби и, кроме того, положительно для всякого конечного p в некоторой области, содержащей экстремаль u(x) внутри, то эта экстремаль дает сильный (абсолютный) минимум.
Пример. Докажем, что экстремаль (1.30) (см Пример 1 в 1.8) дает функционалу (1.28) сильный минимум. Из (1.28) имеем
, , ,
Уравнение (1.40) принимает вид
его решение при условии , имеет вид
.
Функция на отрезке удовлетворяет усиленному условию Якоби, так как на этом отрезке она положительна. Так как то и усиленное условие Лежандра выполняется. Следовательно, экстремаль (1.30) даёт функционалу (1.28) сильный (абсолютный) минимум.
1.9 Изопериметрическая задачаИзопериметрическая задача ставится следующим образом: Даны функционалы и постоянные ; среди элементов области определения D(J) функционала J, удовлетворяющего уравнениям
(1.41)
требуется найти элемент, доставляющий функционалу J наименьшее значение.
Считается, что область
не пуста.
Частным случаем изопериметрической задачи является задача о наибольшей площади, поставленная в 2.2.
Здесь n=1.
(1.42)
За D(J) можно принять множество тех функций из С [a, b], которые обращаются в нуль при x=a и x=b (условие 3), а за – множество функций из С[1] [a, b], удовлетворяющих тем же условиям (1.3). Очевидно пересечение не пусто. Будем считать, что функционалы удовлетворяют требованиям 1,2,3. Пересечение линейных многообразий само есть линейное многообразие, поэтому существует элемент и линейное многообразие такое, что любой элемент имеет вид .
Будем считать, что множество плотно в рассматриваемом пространстве.
Справедлива теорема, принадлежащая Эйлеру и известная под названием правила множителей для изопериметрической задачи.
Теорема Эйлера: Пусть элемент решает изопериметрическую задачу. Если существуют такие элементы , что определитель
(1.43)
отличен от нуля, то найдутся такие постоянные , что
(1.44)
Рассмотренная теорема дает только необходимое условие минимума для изопериметрической задачи.
Техника решения изопериметрической задачи такова: составляя функционал
, (1.45)
где – неизвестные постоянные, и составляем для этого функционала уравнение Эйлера. Оно содержит в качестве неизвестных элемент u0 и постоянные . Эти неизвестные определяются из уравнения Эйлера (1.41) и изопериметрических равенств (1.41).
В качестве примера рассмотрим задачу о наибольшей площади (см. 2.2). В соответствии с теоремой Эйлера введем постоянный множитель и составим функционал
Уравнение Эйлера для функционала Э примет вид
Интегрирование дает
.
Отсюда
.
Интегрируя еще раз, придем к уравнению окружности радиуса
. (1.46)
Таким образом, если решение существует, то это – дуга окружности. Для определения ее радиуса и центра имеем три уравнения
Рис. 1.2. |
.
Пусть будет угол, под которым виден отрезок AB из центра окружности (рис. 2):
.
Для определения имеем уравнение
,
решение которого всегда возможно при указанном выше условии. Подставляя условия (1.3) в уравнение (1.46) находим . Найдя из уравнения (1.46) найдем .
1.10 Минимизирующая последовательностьПусть J-произвольный ограниченный снизу функционал. В этом случае существует нижняя грань его значений
.
Последовательность элементов из D(J) называется минимизирующей для функционала J, если существует предел J(un), равный m.
Теорема 1: Функционал, ограниченный снизу, имеет по крайней мере одну минимизирующую последовательность.
Из определения нижней грани следует, что: 1) для любого элемента справедливо равенство ; 2) для любого существует такой элемент из D(J), что . Положим и обозначим . Тогда , откуда следует, что .
Теорема 2: Пусть D(J) – линейное многообразие некоторого банахова пространства X. Если функционал J непрерывен в D(J) и существует предел минимизирующей последовательности , то элемент сообщает функционалу J минимальное значение.
Доказательство вытекает из непрерывности функционала
.
Теоремы 1, 2 создают возможность решать задачу о минимуме функционала, минуя уравнение Эйлера. Для этого надо прежде всего погрузить множество D(J) в такое банахово пространство X, в котором функционал J был бы непрерывен. Далее следует построить минимизирующую последовательность. Если она сходится, то ее предел решает вариационную задачу.
На этом построены численные вариационные методы (см 15) и обоснование их сходимости.
1.11 Функционал от функций, нескольких независимых переменныхРассмотрим конечную область в m-мерном Евклидовом пространстве. Будем считать, что граница Г области состоит из конечного числа кусочно-гладких (m-1) – мерных поверхностей.
Рассмотрим функционал
(1.47)
при условии , где g(x) – заданная непрерывная функция на поверхности Г. Считаем, что выполнены требования 1, 2, 3.
Найдем первую вариацию функционала (1.47)
(1.48)
Здесь обозначено
.
Пусть функция такова, что существуют обобщенные производные
.
Тогда имеем
и, следовательно
(1.49)
В этом случае уравнение Эйлера для функционала (1.47) принимает вид
, (1.50)
и называется уравнением Остроградского.
Пример.
Найти уравнение Эйлера для функционала
при краевом условии .
Пусть функция подчиняется всем оговоренным выше условиям, тогда уравнение (1.50) принимает вид
. (1.51)
1.12 Функционал от функций, имеющих производные высших порядковРассмотрим функционал вида
. (1.52)
Будем считать, что функция определена в области
и в этой области k раз непрерывно дифференцируема.
Функционал (1.52) зададим на функциях , удовлетворяющих краевым условиям
(1.53)
где Ai, Bi – заданные постоянные. Возьмем функцию в виде , чтобы удовлетворялись требования 1,2,3 и составим функционал
(1.54)
Пусть функция такова, что имеет обобщенную производную j-го порядка, тогда
и, следовательно,
(1.55)
Откуда получим уравнение Эйлера
(1.56)
с краевыми условиями (1.53).
Сказанное выше переносится на случай функции многих независимых переменных. Для функционала
(1.57)
при краевых условиях
(1.58)
где – нормаль к Г.
Уравнение Остроградского будет иметь вид
(1.59)
Это уравнение должно решаться при краевых условиях (1.58)
Пример.
Выражение полной энергии деформации жесткой пластинки (плиты) при малых перемещениях, находящейся под действием поперечной нагрузки , представляет собой функционал вида
(1.60)
где W (x, y) – прогиб пластинки; ;
E, – механические характеристики материала пластинки; h – толщина пластинки.
Функция W (x, y) является непрерывной функцией, имеющую непрерывную производную до четвертого порядка включительно и все требования 1,2,3 будут выполнены.
При шарнирно-неподвижном закреплении краев пластинки должны выполняться условия
При x=0, x=a
(1.61)
При y=0, y=b
(1.62)
Получим уравнение Эйлера(Остроградского) для функционала (1.60) при краевых условиях (1.61), (1.62). Так как
то уравнение Остроградского принимает вид
(1.63)
При этом
Поставив эти выражения в (1.63), получим уравнение Остроградского для функционала (1.60)
. (1.64)
Уравнение (1.64) является уравнением равновесия рассматриваемой пластины и должно решаться при граничных условиях (1.61), (1.62).
1.13 Функционалы, зависящие от нескольких функцийРассмотрим функционал
(1.65)
Зададим его на парах функций из (непрерывных вместе со своей первой производной), удовлетворяющих краевым условиям
(1.66)
где – постоянные. Множество таких пар обозначим через D(J). Каждую такую пару будем называть вектором. За и возьмем функции из , удовлетворяющие условиям
Множество векторов , очевидно линейное, и D(J) есть линейное многообразие. Таким образом функционал (1.65) удовлетворяет требованиям 1,2,3.
Строим две функции, близкие к u(x) и v(x):
и .
Подставив их в функционал (1.65), получим функцию от и . Найдем частные производные от по и при :
Первая вариация функционала (1.65) выражается формулой
где .
Откуда получаем уравнения Эйлера для функционала (1.65) в виде системы двух дифференциальных уравнений
; (1.67)
Эти уравнения должны решаться при краевых условиях (1.66).
... , а также для сравнения степени вариации одноименных признаков в нескольких совокупностях исчисляется относительный показатель вариации — коэффициент вариации (V), который представляет; собой процентное отношение среднего квадратического отклонения к средней арифметической: По величине коэффициента вариации можно судить о степени вариации признаков, а следовательно, об однородности состава ...
... предложения и представляет равновесную цену в каждый период времени. Предположим также, что все прочие внешние факторы ценообразования, кроме налогов, в рассматриваемый период времени остаются неизменными. Р Q Рис.12. Воздействие изменения налога на кривые спроса ...
... ), интересующей органы внутренних дел, и необходимой им для выполнения возложенных задач. При этом необходимо учесть оперативную специфику работы правоохранительных органов. В современных условиях важное значение для выявления, пресечения и расследования налоговых преступлений приобретают сведения о хозяйственной деятельности налогоплательщика, получившие отражение в бухгалтерской документации ...
... основными производственными фондами (факторный признак - х) по данным задачи 1 вычислите коэффициент детерминации и эмпирическое корреляционное отношение. Поясните их значение. 5. ПРАКТИКУМ ПО ТЕОРИИ СТАТИСТИКИ 1. ГРУППИРОВКА СТАТИСТИЧЕСКИХ ДАННЫХ И ЕЕ РОЛЬ В АНАЛИЗЕ ИНФОРМАЦИИ Одним из основных наиболее распространенных методов обработки и анализа первичной статистической информации ...
0 комментариев