Кафедра физхимии ЮФУ (РГУ)
ЧИСЛЕННЫЕ МЕТОДЫ И ПРОГРАММИРОВАНИЕ
Материалы к лекционному курсу
Лектор – ст. преп. Щербаков И.Н.

Системы нелинейных уравнений

При решении задач моделирования поведения химических систем достаточно часто приходится решать системы уравнений, нелинейных по отношению к переменным. Системы n линейных уравнений с n неизвестными x1, x2, ..., xn  в общем случае принято записывать следующим образом:

где F1, F2,…, Fn – любые функции независимых переменных, в том числе и нелинейные относительно неизвестных.

Как и в случае систем линейных уравнений, решением системы является такой вектор (или векторы) (X*), который  при подстановке обращает одновременно все уравнения системы в тождества.

Система уравнений может не иметь решений, иметь единственное решение, конечное или бесконечное количество решений. Вопрос о количестве решений должен решаться для каждой конкретной задачи отдельно. 

Рассмотрим несколько простейших итерационных методов решения систем нелинейных уравнений, а именно, метод простой итерации, метод Зейделя и метод Ньютона.

Метод простой итерации

Для реализации этого метода решаемую систему уравнений необходимо путем алгебраических преобразований привести к следующему виду, выразив из каждого уравнения по одной переменной следующим образом:

Выбирая затем вектор начального приближения

подставляют его в преобразованную систему уравнений. Из первого уравнения получают новое приближение к первой переменной, из второго – второй и т. д. Полученное уточненное значение переменных снова подставляют в эти уравнения и т.д.Таким образом, на (i+1)-м шаге итерационной процедуры имеем

Метод Зейделя

Модификация Зейделя алгоритма простой итерации заключается в использовании уточненных значений переменных уже на текущем итерационном шаге. Так, для уточнения значений первой переменной используются только значения предыдущего шага, для второй переменной – значение x1 текущего шага, а остальных – от предыдущего и т.д.:

Метод Ньютона-Рафсона

Математической основой метода является линеаризация функций F1, F2, Fn (левых частей уравнений, образующих систему) путем разложения в ряд Тейлора в окрестности точки начального приближения к решению и пренебрежением всеми членами ряда кроме линейных относительно приращений переменных.

Рассмотрим метод на примере системы двух уравнений с двумя неизвестными:

Линеаризуем функции F1, F2 путем разложения в ряд Тейлора вблизи некоторой точки (начального приближения) и пренебрежения всеми членами ряда кроме линейных относительно приращений переменных.

Вспомним, что для функции одной переменной разложение в ряд Тейлора в окрестности некоторой точки x0 имеет следующий вид:

после пренебрежения всеми членами, кроме линейного:

Для функции нескольких переменных разложение проводится аналогично.

Выберем для поиска решения системы уравнений некоторое начальное приближение

Запишем для функции F1 2-х переменных линейную часть разложения в ряд Тейлора в окрестности выбранной точки

для второго уравнения, аналогично

Если значения переменных x1 и x2 являются решением, то оба уравнения системы должны обратиться в ноль, поэтому полученные разложения приравниваем нулю.

Для краткости записи введем следующие обозначения:

 - приращение i-ой переменной  

- значение первой частной производной функции Fj по переменной xi при значении переменных 

 – значение  j-ой функции при соответствующих значениях переменных, то есть невязка j‑го уравнения. 

Получим систему линейных уравнений 2 x 2 относительно приращения переменных

Или, в матричной форме,

где матрица значений частных производных называется матрицей Якоби (или якобианом). Решение этой системы дает вектор поправок к начальному приближению.

Сложение его с вектором начального приближения дает новые значения переменных.

Итерационная процедура далее продолжается аналогично.

Таким образом, процедура решения выглядит следующим образом:

1.     Выбирается начальное приближение, система приводится к нормальному виду, в аналитическом виде находятся частные производные правых частей уравнений системы по всем переменным.

2.     Рассчитывается матрица Якоби значений частных производных в точке начального приближения

3.     Решается система линейных уравнений относительно приращений переменных.

4.     к вектору начального приближения прибавляется вектор приращений

5.     проверяется условие сходимости и, если оно не достигнуто, то процедура повторяется с п. 2.

 

Метод легко обобщается на систему уравнений любой размерности.   

Для функции F1  n  переменных линейная часть разложения в ряд Тейлора в окрестности точки записывается так

После разложения всех уравнений системы и используя введенные ранее обозначения, после преобразования получим систему линейных уравнений порядка  n относительно приращения переменных Δxi

Или, в матричной форме,

В сокращенном виде можно записать так - (F')(Δx) = -(F)  , где матрица значений частных производных – (F') – называется матрицей Якоби или якобианом системы уравнений.

Решение этой системы дает вектор поправок к начальному приближению. Сложение его с вектором начального приближения дает новые, уточненные значения переменных. 

Частные производные, необходимые для расчета матрицы Якоби, можно рассчитать аналитически или же, если это невозможно или затруднительно, получать по формулам приближенного дифференцирования, например, как отношение приращения функции к приращению аргумента

  ,

где эпсилон – достаточно малое число.

Методы контроля сходимости итерационных методов
решения систем

Сходимость итерационного процесса решения системы нелинейных уравнений можно контролировать несколькими способами, например:

1.  Норма (эвклидова или -максимум) вектора невязок 

2.  Эвклидова норма вектора относительных отклонений переменных

 

3.  Норма-максимум вектора относительных отклонений   

Пример

Применим метод Ньютона для решения системы уравнений

Матрица частных производных (в аналитическом виде)

Система линейных уравнений

Может быть решена аналитически или методом Крамера или методом обращения матрицы. Возьмем начальное приближение x = 0,15, y = 0,17

Первая итерация:

Матрица Якоби -

вектор значений функции

Рассчитанный вектор поправок

Новое приближение x = 0,15 + 0,028704 = 0,178704,    y = 0,17 + 0,090926 = 0,260926

Вторая итерация:

Рассчитанный вектор поправок

Новое приближение x = 0,196656,    y = 0,293359

Третья итерация:

Рассчитанный вектор поправок

Новое приближение x = 0,199867,    y = 0,299739

Уже на 6-й итерации эвклидова норма вектора невязок составляет  2.8∙10-13, максимальное относительное изменение переменных составляет  1.6∙10-12 и решение сходится к  x = 0.2, y = 0.3 с абсолютной погрешностью менее 5∙10-7.

Метод простой итерации при этих же начальных условиях сходится с такой точностью на 33-м шаге, модификация Зейделя – на 31-м шаге.

На рисунке ниже представлен пример организации вычислений при решении рассмотренной системы в программе MS Excel

Пояснения: В ячейки В3 и В4 помещены начальные приближения к решению системы (значения х0 и у0, соответственно). В диапазоне ячеек D3:E4  помещены формулы для вычисления матрицы Якоби, при условии что х находится в ячейке В3, а у - в ячейке В4 (формулы приведены на рисунке ниже). В ячейках  G3:G4 рассчитывается значение вектора невязок с отрицательным знаком.

В ячейке Н3 вычисляется эвклидова норма вектора невязок. В  ячейках I3:I4 - решается система линейных уравнений и вычисляется вектор поправок к решению. Для этого обращается матрица коэффициентов системы (матрица Якоби) и умножается на вектор-столбец свободных членов (отрицательный вектор невязок). Формула в этот диапазон ячеек вводится как формула массива. Рядом - в ячейке J3 - рассчитывается норма вектора поправок для контроля сходимости (см. формулы на рисунке ниже).

Полученные в ячейках I3:I4 значения поправок на втором итерационном цикле прибавляются к начальному приближению (в ячейках В6:В7) и далее вычисления повторяются аналогично первому циклу.

Набранные в строках 6 и 7 рабочего листа формулы могут копироваться до тех пор, пока не будет достигнута необходимая точность.

Задачи, сводящиеся к решению системы нелинейных уравнений

Примером задачи, в которой используется решение систем нелинейных уравнений, может служить аппроксимация таблично заданной функции математическими моделями, нелинейными по отношению к параметрам. Подробно она описывалась ранее.

Если аппроксимирующую функцию и определяющие ее параметры ai обозначить следующим образом

то условие прохождения графика функции через все таблично заданные точки можно записать в виде следующей системы:

Другой пример - поиск экстремума (минимума или максимума) функции нескольких переменных

Условием экстремума является одновременное равенство нулю всех частных производных функции. Таким образом, необходимо решить систему уравнений следующего вида, которая, в общем случае, будет нелинейной

В начало страницы

Rambler's Top100 Рейтинг@Mail.ru