Экстремальное управление. Адаптивные и экстремальные системы управления
Цель работы
Ознакомиться с построением шаговых экстремальных систем управления при управлении динамическими объектами с запаздыванием.
Теоретическая часть
В любом производстве (на заводе, комбинате) имеется некоторый ведущий технико-экономический показатель (ТЭП), полностью характеризующий эффективность работы этого производства. Этот ведущий показатель выгодно поддерживать на экстремальном значении. Таким обобщенным показателем может быть прибыль предприятия.
Для всех технологических процессов (в цехах, отделениях), входящих в состав производства, исходя из ведущего ТЭП, можно сформулировать свои частные ТЭП (например, себестоимость единицы продукции при заданной производительности). В свою очередь технологический процесс обычно можно разбить на ряд участков (технологических агрегатов), для каждого из которых также можно найти критерий оптимальности Q. Достижение экстремума Q будет приближать к экстремуму частный ТЭП процесса и ведущий ТЭП производства в целом.
Критерий оптимальности Q может быть непосредственно каким-либо технологическим параметром (например, температура факела топочного устройства) либо некоторой функцией, зависящей от технологических параметров (например, к.п.д., тепловой эффект реакции, выход полезного продукта за заданный промежуток времени и т.д.).
Если критерий оптимальности Q является функцией некоторых параметров объекта, то для оптимизации этого объекта может быть применена система экстремального регулирования (СЭР).
В общем случае величина критерия оптимальности зависит от изменения ряда входных параметров объекта. Имеется много объектов управления, у которых величина критерия оптимальности Q зависит в основном от изменения одного входного параметра. Примерами таких объектов могут служить различного рода топочные устройства, каталитические реакторы, химводоочистка на тепловых электростанциях и многие другие.
Итак, системы экстремального регулирования предназначены для поиска оптимальных значений управляющих воздействий, т.е. таких значений, которые обеспечивают экстремум некоторого критерия Q оптимальности процесса.
Системы экстремального регулирования, которые предназначены для оптимизации объекта по одному входному каналу, называются одноканальными. Такие СЭР получили наибольшее распространение.
При оптимизации объектов, обладающих значительной инерционностью и чистым запаздыванием, целесообразно применение шаговых экстремальных систем, которые воздействуют на управляемый вход объекта через дискретные промежутки времени.
При исследовании экстремальной системы объект оптимизации в большинстве случаев удобно представить последовательным соединением трех звеньев: входного линейного инерционного звена, экстремальной статической характеристики у = F (х ) и выходного линейного инерционного звена (рис. 1). Такую структурную схему замещения можно обозначить ЛНЛ.
Рис. 1 Схема экстремального объекта ЛНЛ
Коэффициенты усиления обоих линейных звеньев удобно принимать равными единице. Если инерционность входного линейного звена пренебрежимо мала по сравнению с инерционностью выходного линейного звена, объект можно представить схемой замещения НЛ; если инерционность выходного линейного звена пренебрежимо мала, - схемой замещения ЛН. Собственные инерционные свойства объекта обычно представляются выходным инерционным звеном; к этому же звену относится инерционность измерительных устройств системы.
Входное линейное звено обычно появляется в структурной схеме объекта тогда, когда исполнительный механизм (ИМ) экстремальной системы воздействует на собственно объект оптимизации через звено, обладающее инерционностью, например, если входным параметром оптимизируемого объекта является температура, а ИМ воздействует на изменение ее через теплообменник. К входной линейной части относят и инерционность исполнительного механизма.
Следует отметить, что промежуточные между линейными и нелинейными звеньями координаты объекта управления в подавляющем большинстве случаев замерить невозможно; это легко осуществить лишь при моделировании системы.
В некоторых случаях определить структурную схему замещения объекта можно лишь экспериментально.
Для этого следует изменить входную координату объекта v 1 , соответствующую значению выхода z 1 , до v 2 (рис. 2,а ), при котором значение выходной координаты объекта в результате переходного процесса будет приближенно равно z 1 .
Если это возмущение практически не вызвало сколько-нибудь заметного изменения выходной координаты объекта (рис. 2,б ), то входное инерционное звено отсутствует. Если же переходный процесс в результате такого возмущения имеет вид, качественно близкий к представленному на рис. 2, в , то инерционное звено на входе объекта существует.
Рис. 2 Характеристики экстремального ОУ
Структурой объектов НЛ и ЛН, у которых линейная часть описывается дифференциальным уравнением первого порядка с запаздыванием или без него, а статическая характеристика y=f (x ) может быть любой непрерывной функцией с одним экстремумом в рабочем диапазоне может быть аппроксимировано достаточно большое количество промышленных объектов оптимизации.
Системы экстремального управления:
Системы автоматической оптимизации с запоминанием экстремума
В экстремальных регуляторах САО с запоминанием экстремума на сигнум-реле подается разность между текущим значением выходного сигнала у объекта и его значением в предыдущий момент времени.
Структурная схема САО с запоминанием экстремума представлена на рис. 3. Выходная величина объекта О со статической характеристикой у=f (х ) подается на запоминающее устройство ЗУ экстремального регулятора.
Рис. 3 Система автоматической оптимизации с запоминанием экстремума
Запоминающее устройство такой системы должно фиксировать только увеличение входного сигнала, т.е. запоминание происходит только при увеличении у. На уменьшение у запоминающее устройство не реагирует. Сигнал с запоминающего устройства непрерывно подается на элемент сравнения ЭС, где сравнивается с текущим значением сигнала у. Сигнал разности у -у макс с элемента сравнения поступает на сигнум-реле СР. Когда разность у -y макс достигает значения зоны нечувствительности у н сигнум-реле, оно производит реверс исполнительного механизма ИМ, который воздействует на входной сигнал х объекта. После срабатывания сигнум-реле запомненное запоминающим устройством ЗУ значение y сбрасывается и запоминание сигнала у начинается снова.
Системы с запоминанием экстремума обычно имеют исполнительные механизмы с постоянной скоростью перемещения, т.е. dx/dt=±k 1 где k =const. В зависимости от сигнала и сигнум-реле исполнительный механизм меняет направление перемещения.
Поясним работу САО с запоминанием экстремума. Допустим, что в момент t 1 (рис. 4), когда состояние объекта характеризуется значениями сигналов на входе и выходе соответственно х 1 и у 1 (точка М 1), включен в работу экстремальный регулятор. В этот момент запоминающее устройство запоминает сигнал у 1 . Предположим, что экстремальный регулятор после включения в работу начал увеличивать значение х, при этом значение у уменьшается - запоминающее устройство не реагирует на это. В результате на выходе сигнум-реле появляется сигнал у -у 1 . В момент t сигнал у -у 1 достигает зоны нечувствительности сигнум-реле у н (точка М 2), которое срабатывает, производя реверс исполнительного механизма. После этого запомненное значение у 1 сбрасывается и запоминающее устройство запоминает новое значение у 2 . Сигнал входа объекта х уменьшается, а сигнал выхода у возрастает (траектория от точки М 2 к М 3). Поскольку у все время увеличивается, выход ЗУ непрерывно следует за изменением у.
Рис. 4 Поиск оптимума в САО с запоминанием экстремума:
а - характеристика объекта; б - изменение выхода объекта; в - сигнал на входе сигнум-реле; г - изменение входа объекта.
В точке М 3 система достигает экстремума, но уменьшение х продолжается. Вследствие этого после точки М 3 значение у уже уменьшается и ЗУ запоминает y макс. Теперь на входе сигнум-реле СР опять появляется сигнал разности у-у макс. В точке M 4 , когда y 4 -y макс =y н, сигнум-реле срабатывает, производя реверс исполнительного механизма и сброс запомненного значения y макс и т.д.
Устанавливаются колебания вокруг экстремума регулируемой величины. Из рис. 4 видно, что период колебаний входа Т вх объекта в 2 раза больше, чем период колебаний выхода объекта Т вых. Сигнум-реле реверсирует ИМ при y =y макс -y н. Направление движения ИМ после срабатывания сигнум-реле зависит от направления движения ИМ до срабатывания сигнум-реле.
Из рассмотрения работы САО с запоминанием экстремума видно, что ее название не совсем точно отражает сущность действия системы. Запоминающее устройство фиксирует не экстремум статической характеристики объекта (его значение в момент включения регулятора в работу неизвестно). Запоминающее устройство фиксирует значения выходной величины у объекта, когда у увеличивается.
Системы автоматической оптимизации шагового типа
Структурная схема шаговой САО показана на рис. 5. Измерение выходного сигнала у объекта в системе происходит дискретно (за датчиком выхода объекта имеется импульсный элемент ИЭ 1), т. е. через определенные промежутки времени ∆t (∆t - период повторения импульсного элемента). Таким образом, импульсный элемент преобразует изменяющийся выходной сигнал у объекта в последовательность импульсов, высота которых пропорциональна значениям у в моменты времени t=n ∆t, называемые моментами съема. Обозначим значения у в момент времени t=n ∆t через у п. Значения у n подаются на запоминающее устройство ЗУ (элемент запаздывания). Запоминающее устройство подает на элемент сравнения ЭС предыдущее значение у п- 1 . На ЭС одновременно поступает y n . На выходе элемента сравнения получается сигнал разности ∆y n =y n -у п- 1 В следующий момент t =(n +1) ∆t съема сигнала запомненное значение у п- 1 сбрасывается с ЗУ и запоминается сигнал у п+ 1 , a cигнал у п поступает с ЗУ на ЭС и на входе сигнум-реле СР появляется сигнал ∆у п+ 1 = y n + 1 -y n .
Рис. 5 Структура дискретной (шаговой ) САО
Итак, на сигнум-релe в шаговой САО подаетcя сигнал, пропорциональный приращению ∆у выхода объекта за отрезок времени ∆t. Если ∆у>0 то такое движение допускается сигнум-реле; если ∆у<0, то сигнум-реле срабатывает и изменяет направление сигнала входа х.
Между сигнум-реле СР и исполнительным механизмом ИМ (рис. 5) включен еще один импульсный элемент ИЭ 2 (работающий синхронно с ИЭ 1), который осуществляет периодическое размыкание цепи питания ИМ, останавливая ИМ на это время.
Исполнительный механизм в подобных САО обычно осуществляет изменение входа х объекта шагами на постоянное значение ∆х. Изменение входного сигнала объекта на шаг целесообразно производить быстро, чтобы время перемещения исполнительного механизма на один шаг было достаточно мало. При этом возмущения, вносимые в объект исполнительным механизмом, будут приближаться к скачкообразным.
Таким образом, сигнум-реле изменяет направление последующего шага ∆х п+ 1 исполнительного механизма, если значение ∆у п становится меньше нуля.
Рассмотрим характер поиска экстремума в шаговой САО с безынерционным объектом. Допустим, что начальное состояние объекта характеризуется точкой M 1 на статической зависимости y=f (x ) (рис.6,а). Предположим, что экстремальный регулятор включается в работу в момент времени t 1 и исполнительный механизм делает шаг ∆х на увеличение сигнала входа объекта.
Рис. 6 Поиск в дискретной САО : а - характеристика объекта; б - изменение выхода; в - изменение входа
Сигнал на выходе объекта у при этом также увеличивается. Через время ∆t (в момент времени t 2) исполнительный механизм производит шаг в ту же сторону, так как ∆у 1 =у 2 -y 1 >0. В момент t 3 исполнительный механизм производит еще один шаг на ∆х в ту же сторону, так как ∆y 2 =y 3 -y 2 больше нуля, и т. д. В момент времени t 5 приращение выходного сигнала объекта ∆y 3 =y 5 -y 4 , станет меньше нуля, сигнум-реле срабатывает и следующий шаг ∆х исполнительный механизм сделает в сторону уменьшения сигнала входа объекта х и т. д.
В шаговых САО для обеспечения устойчивости необходимо, чтобы движение системы к экстремуму было немонотонным.
Существуют шаговые САО, у которых изменение сигнала на входе за один шаг ∆х переменно и зависит от значения y .
Системы автоматической оптимизации с управлением по производной
Системы автоматической оптимизации с управлением по производной используют то свойство экстремальной статической характеристики, что производная dy/dx равна нулю при значении входного сигнала объекта х=х опт (см. рис. 7).
Рис. 7 График изменения производной унимодальной характеристики
Структурная схема одной из таких САО приведена на рис. 8. Значения входного и выходного сигналов объекта О подаются на два дифференциатора Д 1 и Д 2 , на выходе которых получаются сигналы соответственно dx/dt и dy/dt. Сигналы производных поступают на делительное устройство ДУ.
Рис. 8 Структура САО с измерением производной статической характеристики
На выходе ДУ получается сигнал dy/dx, который подается на усилитель У с коэффициентом усиления k 2 . Сигнал с выхода усилителя поступает на исполнительный механизм ИМ с переменной скоростью перемещения, значение которой пропорционально выходному сигналу усилителя и. Коэффициент усиления ИМ равен k 1 .
Если статическая характеристика объекта y=f (x ) имеет форму параболы y=-kx 2 , то САО описывается линейными уравнениями (при отсутствии возмущений), так как dy/dx= -2kx, а остальные звенья системы линейны. Логическое устройство для определения направления движения к экстремуму в такой системе не применяется, так как она чисто линейна и в ней, казалось бы, заранее известно значение экстремума (поскольку dy/dx= 0 при x=x oiit).
В момент включения САО в работу на ИМ подается некоторый сигнал для приведения его в движение, в противном случае dx/dt= 0 и dy/dt= 0 (при отсутствии случайных возмущений). После этого САО работает, как обычная САР, у которой заданием является величина dy/dx= 0.
Описанная система обладает рядом недостатков, которые делают ее практически малоприменимой. Во-первых, при dx/dt→
0 производная dy/dt
также стремится к нулю - задача отыскания экстремума становится неопределенной. Во-вторых, реальные объекты обладают запаздыванием, поэтому необходимо делить друг на друга не одновременно замеренные производные dy/dt
и dx/dt,
а сдвинутые по времени в точности на время задержки сигнала в объекте, что выполнить достаточно сложно. В-третьих, отсутствие в такой САО логического устройства (сигнум-реле) приводит к тому, что в некоторых условиях система теряет работоспособность. Допустим, что САО включилась в работу при x
Кроме того, даже если такая система в начальный момент движется к экстремуму, то она теряет работоспособность при сколь угодно малом дрейфе статической характеристики без коммутатора поверочных реверсов.
Рис. 9 Система оптимизации с измерением производной выхода объекта:
а - структура системы; б - характеристика объекта; в - изменение выхода; г - сигнал на входе, д - изменение входа объекта.
Рассмотрим другой тип САО с измерением производной и исполнительным механизмом ИМ постоянной скорости перемещения, структурная схема которой представлена на рис. 9.
Рассмотрим характер поиска экстремума САО с измерением производной со структурной схемой, показанной на рис. 9,а .
Пусть безынерционный объект регулирования О (рис. 9,а) имеет статическую характеристику, показанную на рис. 9,б . Состояние САО в момент включения экстремального регулятора определяется значениями сигналов входа x 1 и выхода у 1 - точка М 1 на статической характеристике.
Предположим, что экстремальный регулятор после включения его в работу в момент времени t 1 изменяет сигнал на входе х в сторону увеличения. При этом сигнал на выходе объекта у будет изменяться в соответствии со статической характеристикой (рис. 9,в ), а производная dy/dt при движении от точки М 1 до М 2 уменьшается (рис. 9,г ). В момент времени t 2 выход объекта достигнет экстремума у макс, а производная dy/dt будет равна нулю. За счет нечувствительности сигнум-реле система будет продолжать движение, удаляясь от экстремума. При этом производная dy/dt изменит знак и станет отрицательной. В момент t 3 , когда значение dy/dt, оставаясь отрицательным, превысит зону нечувствительности сигнум-реле (dy/dt ) H , произойдет реверс исполнительного механизма и входной сигнал х начнет уменьшаться. Выход объекта начнет снова приближаться к экстремуму, а производная dy/dt станет положительной при движении от точки М 3 до М 4 (рис. 9,в ). В момент времени t 4 сигнал на выходе снова достигает экстремума, а производная dy/dt=0.
Однако за счет нечувствительности сигнум-реле движение системы будет продолжаться, производная dy/dt станет отрицательной и в точке М 5 снова произойдет реверс и т.д.
В этой системе дифференцируется только выходной сигнал объекта, который подается на сигнум-реле СР. Поскольку при переходе системы через экстремум знак dy/dt изменяется, то для отыскания экстремума нужно реверсировать ИМ, когда производная dy/dt станет отрицательной и превысит зону нечувствительности (dy/dt ) H сигнум-реле.
Система, реагирующая на знак dy/dt, по принципу действия близка к шаговой САО, но менее помехоустойчива.
Системы автоматической оптимизации с вспомогательной модуляцией
В некоторых работах такие системы автоматической оптимизации называются системами с непрерывным поисковым сигналом или по терминологии А.А. Красовского просто непрерывными системами экстремального регулирования.
В этих системах используется свойство статической характеристики изменять фазу колебаний выходного сигнала объекта по сравнению с фазой входных колебаний объекта на 180° при переходе выходного сигнала объекта через экстремум (см. рис. 10).
Рис. 10 Характер прохождения гармонических колебаний через унимодальную характеристику
В отличие от рассмотренных выше САО системы с вспомогательной модуляцией имеют раздельные поисковые и рабочие движения.
Структурная схема САО с вспомогательной модуляцией представлена на рис. 11. Входной сигнал х объекта О с характеристикой y=f (x ) представляет собой сумму двух составляющих: x=x o (t )+a sinω 0 t , где а и ω 0 - постоянные величины. Составляющая a sinω 0 t является пробным движением и вырабатывается генератором Г, составляющая x o (t ) является рабочим движением. При движении к экстремуму переменная составляющая a sinω 0 t входного сигнала объекта вызывает появление переменной составляющей той же частоты ω 0 =2π/Т 0 в выходном сигнале объекта (см. рис. 10). Переменная составляющая может быть найдена графически, как это показано на рис. 10.
Рис. 11 Структура САО с вспомогательной модуляцией
Очевидно, что переменная составляющая сигнала на выходе объекта совпадает по фазе с переменной составляющей сигнала на входе для любого значения входа, когда x
0 =x
1
Амплитуда а поисковых колебаний должна быть невелика, так как эти колебания проходят в выходной сигнал объекта и приводят к погрешности в определении экстремума.
Составляющая величины у, имеющая частоту ω 0 , выделяется полосовым фильтром Ф 1 (рис. 11). Задача фильтра Ф 1 состоит в том, чтобы не пропускать постоянную или медленно меняющуюся составляющую и составляющие второй и высших гармоник. В идеальном случае фильтр должен пропускать только составляющую с частотой ω 0.
После фильтра Ф 1 переменная составляющая величины у, имеющая частоту ω 0 , подается на множительное звено МЗ (синхронный детектор). На вход множительного звена подается также опорная величина v 1 =a sin (ω 0 t + φ ). Фаза φ опорного напряжения v 1 подбирается в зависимости от фазы выхода фильтра Ф 1 , поскольку фильтр Ф 1 вносит дополнительный сдвиг фазы.
Напряжение на выходе множительного звена u=vv 1 . При значении x <x опт
u = vv 1 = b sin (ω 0 t + φ ) a sin (ω 0 t + φ ) = аb sin 2 (ω 0 t + φ ) = = ab/ 2 .
При значении сигнала на входе x >х 0ПТ значение сигнала на выходе множительного звена МЗ составляет:
и = vv 1 = b sin (ω 0 t + φ + 180°) a sin (ω 0 t + φ ) = - ab sin 2 (ω 0 t + φ ) = = - ab/ 2 .
Рис. 12 Характер поиска в САО с вспомогательной модуляцией:
а - характеристика объекта; б -изменение фазы колебаний; в - гармонические колебания на входе; г - суммарный сигнал на входе; д - сигнал на выходе множительного звена.
После множительного звена сигнал и подается на низкочастотный фильтр Ф 2 , который не пропускает переменную составляющую сигнала и. Постоянная составляющая сигнала и=и 1 после фильтра Ф 2 подается на релейный элемент РЭ. Релейный элемент управляет исполнительным механизмом с постоянной скоростью перемещения. Вместо релейного элемента в схеме может быть фазочувствительный усилитель; тогда исполнительный механизм будет иметь переменную скорость перемещения.
На рис. 12 показан характер поиска экстремума в САО с вспомогательной модуляцией, структурная схема которой приведена на рис. 11. Предположим, что начальное состояние системы характеризуется сигналами на входе и выходе объекта соответственно х 1 и y 1 (точка M 1 на рис. 12,а).
Поскольку в точке М 1 значение x 1 <х опт то при включении экстремального регулятора фазы входных и выходных колебаний будут совпадать. Допустим, что при этом постоянная составляющая на выходе фильтра Ф 2 положительна (аb /2>0), что соответствует движению с возрастанием х, т. е. dx 0 /dt>0. При этом САО будет двигаться к экстремуму.
Если начальная точка М 2 , характеризующая положение системы в момент включения экстремального регулятора, такова, что сигнал входа объекта x >x опт (рис. 12,а), то колебания сигналов входа и выхода объекта находятся в противофазе. Вследствие этого постоянная составляющая на выходе Ф 2 будет отрицательна (ab /2<0), что вызовет движение системы в сторону уменьшения х (dx 0 /dt<0 ). В этом случае САО будет приближаться к экстремуму.
Таким образом, независимо от начального состояния системы будет обеспечен поиск экстремума.
В системах с исполнительным механизмом переменной скорости скорость движения системы к экстремуму будет зависеть от амплитуды выходных колебаний объекта, а эта амплитуда определяется отклонением сигнала входа х от значения х опт
Задача оптимизации обычно состоит в отыскании и поддержании таких управляющих воздействий, при которых обеспечивается экстремум некоторого критерия качества функционирования объекта управления. Эта задача может решаться автоматически с помощью экстремальных регуляторов, осуществляющих в процессе работы поиск оптимальных управляющих воздействий. Системы, реализующие автоматический поиск и сопровождение экстремума некоторого показателя качества работы объекта, называются экстремальными системами управления или системами автоматической оптимизации. Системы автоматической оптимизации, благодаря реализации в них алгоритмов поиска оптимальных управлений, обладают рядом преимуществ, главным из которых является их свойство нормально функционировать в условиях неполной априорной информации об объекте и о действующих на него возмущениях. Применение экстремальных систем управления целесообразно в тех случаях, когда критерий качества работы объекта имеет ярко выраженный экстремум и имеются возможности реализации поиска и поддержания оптимального (экстремального) его режима функционирования. Развитие теории и техники экстремальных систем управления достигло в настоящее время значительного уровня. Промышленностью выпускаются типовые экстремальные регуляторы (автоматические оптимизаторы) для ряда технологических процессов.
Экстремальные системы управления составляют один из наиболее теоритически и практически развитых классов адаптивных систем. Экстремальными называются такие объекты автоматического управления, в которых статическая характеристика имеет экстремум, положение и величина которого не известны и могут изменяться непрерывным образом.
Обычно экстремальный регулятор осуществляет поиск и поддержание таких значений координат объекта , при которых выход достигает экстремального значения. Такой режим работы объекта и системы в целом является оптимальным в смысле минимума или максимума критерия качества. Примером одномерного экстремального объекта может служить самолет. Зависимость километрового расхода топлива y от скорости полета x характеризуется наличием экстремума, величина и положение которого изменяются при изменении веса самолета за счет расхода топлива.
В зависимости от количества экстремумов объекты разделяются на одноэкстремальные и многоэкстремальные, причем в последнем случае задача управления заключается в отыскании глобального экстремума, т.е. наибольшего максимума или наименьшего минимума. В зависимости от числа управляющих воздействий, формируемых в экстремальном регуляторе, различают одномерные и многомерные системы экстремального управления. По характеру работы во времени экстремальные системы могут быть непрерывными и дискретными. В зависимости от характера поискового сигнала различают экстремальные системы с детерминированными и случайными поисковыми сигналами.
Область применения XPM не ограничивается разработкой программного обеспечения. Экстремальный проектный менеджмент будет эффективен для опытных команд, которые реализуют инновационные проекты, стартапы, работают в хаотичных, непредсказуемых условиях.
Что такое Extreme Project Management?
Концепция XPM была разработана в 2004 году. Но считать его единственным разработчиком было бы несправедливо. Дуг вдохновился рядом методик других авторов:
- моделью радикального проектного менеджмента Роба Томсета ,
- APM Джима Хайсмита ,
- концепцией экстремального программирования Кента Бэка .
В основу Extreme Project Management ДеКарло вложил теорию хаоса и сложные адаптивные системы.
Теория хаоса — математическая область, посвящённая описанию и изучению поведения нелинейных динамических систем, которые в определенных условиях подвержены так называемому динамическому хаосу.
Сложная адаптивная система — система из множества взаимодействующих компонентов, которая отвечает ряду условий (фрактальное строение, способность к адаптивной активности и т.д.). В качестве примеров САС можно привести город, экосистемы, фондовый рынок.
Дуг сравнивает экстремальный проектный менеджмент с джазом.
Хоть джаз и может звучать хаотично, у него есть своя структура, благодаря которой музыканты имеют возможность импровизировать и создавать настоящие шедевры.
Вместо того, чтобы идти по проторенной дорожке, в Extreme Project Management проектные менеджеры обсуждают лучшую альтернативу с клиентом, экспериментируют, изучают результаты и используют эти знания в следующем проектном цикле.
Одно из свойств некоторых хаотичных систем,
которые являются объектами рассмотрения теории хаоса — «эффект бабочки»,
ставший популярным после «И грянул гром» Рэя Брэдбери
Брайан Вэрнхем, автор книги « », выделил пять шагов, по которым должна следовать команда, работающая по методике экстремального проектного менеджмента, для успешного завершения проекта:
- Увидеть — четко обозначьте видение проекта перед началом экстремального проектного менеджмента
- Творить — вовлекайте команду в креативный мыслительный процесс и мозговой штурм для создания и отбора идей по достижению установившегося видения проекта
- Обновить — стимулируйте команду проверить свои идеи через внедрение инновационных решений
- Переоценить — при приближении цикла разработки к концу команда должна сделать переоценку своей работы
- Распространить — после прохождения обучения важно распространить знания и применить их к будущим этапам проекта, а также к новым проектам в целом.
Так как во главе угла Extreme Project Management стоят люди, то это определяет и специфику измерения успеха XPM-проекта:
- пользователи удовлетворены прогрессом и промежуточными доставками — есть ощущение того, что проект движется в верном направлении, несмотря на окружающую нестабильность.
- пользователи довольны конечной доставкой.
- члены команды довольны качеством своей жизни во время работы над проектом. Если спросить их, хотели бы они поработать над похожим проектом, большая часть ответит "да«.
Плюсы и минусы XPM
Среди основных преимуществ методологии нужно отметить такие:
- целостность — несмотря на то, что Extreme Project Management включает самые разные методы, инструменты и шаблоны, они имеют смысл только при применению ко всему проекту в целом. Вы как проектный менеджер можете видеть весь проект как единую систему без необходимости анализировать отдельные её части
- человеко-ориентированность — в XPM акцент делается на динамике проекта. Он позволяет заинтересованным сторонам взаимодействовать и общаться, и в итоге — удовлетворять потребности клиента
- фокус на бизнес — как только будет достигнут результат, у вас будет четкое видение того, как проект может принести пользу вашему клиенту. Команда постоянно сосредоточена на ранней и частой доставке продукта
- гуманизм — один из принципов Extreme Project Management. Заключается в учёте качества жизни вовлеченных в проект людей. Будучи неотъемлемой частью проекта, увлечение работой и корпоративный дух сильно влияют на бизнес, поэтому во время работы над проектом важно физическое и моральное состояние команды
- реальность в качестве основы — экстремальный проектный менеджмент позволяет работать в непредсказуемой, хаотичной среде. Вы не можете изменить реальность для приспособления к проекту. Происходит обратное: вы адаптируете проект под внешние факторы.
Не обошлось и без минусов. К ним можно причислить:
- неопределённость — эта особенность отсекает большой сектор проектов, начиная с имеющих критическую опасность (военные объекты, атомные станции, приложения интернет-банкинга и т.п.), заканчивая тендерными проектами со строго оговоренным бюджетом, сроками и другими свойствами проекта;
- высокие требования к опыту и квалификации проектной команды — необходимо постоянно приспосабливаться к изменениям в проектной среде, наладить эффективную коммуникацию друг с другом, стейкхолдерами и проектным менеджером, и работать короткими итерациями (последнее актуально для IT-сферы);
- необходимость сменить образ мышления — в отличие от традиционного проектного менеджмента, в котором работа над проектом идёт по привычным этапам, согласно утвержденному плану и ролям, в XPM команде нужно перестроиться и быть готовым к невозможности полного контроля над проектом;
- невозможность долгосрочного планирования — вчерашний план по актуальности будет не свежее новостей за прошлый месяц. Для корректной работы команды по достижению цели проекта нужно проявить качества гибкости и самоорганизации.
- проект создаётся в динамичной среде — происходит постоянная смена обстоятельств, скорости, требований;
- возможно применение метода проб и ошибок в работе над проектом;
- над проектом работает опытная команда — в отличие от традиционного проектного менеджмента, во главе угла стоят люди, а не процессы;
- разрабатываете приложение — за жизненный цикл разработки программное обеспечение в большинстве случаев успевает сменить функционал или расширить список доступных платформ. Чем больше пользователей пользуются ПО, тем больше изменений может быть внесено, для чего и отлично подходит экстремальный проектный менеджмент
- это мета-проект — то есть который делится на много мелких проектов. XPM в этом случае поможет справиться с задержкой в старте работы;
- владелец бизнеса готов участвовать в работе над проектом от начала до конца. Должны быть налажены связи «проектный-менеджер — бизнесмен»,
«проектный-менеджер — стейкхолдер»,
"менеджер проекта — владелец бизнеса — стейкхолдер«.
Стейкхолдеры — люди и организации, которые так или иначе оказывают влияние на проект. Сюда относятся и активно вовлеченные в него (проектная команда, спонсор), и те, кто будут пользоваться результатами проекта (заказчик), и люди, которые могут влиять на проект, хотя и не участвуют в нём (акционеры, компании-партнёры).
Экстремальный проектный менеджмент требует быстрой адаптации команды к необычным, постоянно меняющимся условиям, в которых предстоит работать. Поэтому можно выделить несколько ключевых правил, которые обязательны для эффективного использования Extreme Project Management:
Наочный пример отличия классического проектного менеджмента от экстремального . В первом достигается запланированный результат, во втором — желаемый.
eXtreme Project Management:
Using Leadership, Principles, and Tools to Deliver Value in the Face of Volatility Дуг ДеКарло
№ 1 для всех, кто хочет освоить Extreme Project Management. На основе опыта работы с более чем 250 проектными командами автор написал подробный справочник по экстремальному проектному менеджменту. О книге восторженно отзываются проектные менеджеры крупнейших международных организаций: Management Solutions Group, Inc., Zero Boundary Inc., Guru Unlimited и т.д.
Effective Project Management: Traditional, Adaptive, Extreme,
Third Edition Роберт К. Высоцкий
Прочитав который можно составить представление не только об экстремальном проектном менеджменте, но и адаптивном. Из интересного — в конце каждой главы даются вопросы для упорядочивания поданного материала, который насыщен реальными кейсами проектов из разных сфер.
Radical Project Management Роб Томсетт
В экстремальный проектный менеджмент представлен от «А» до «Я», разобран каждый инструмент и техника, с помощью которых внедряется Extreme Project Management. Максимум практической информации с разбором кейсов.
Architectural Practices: Extreme Project Management for Architects
Не книга, а , но не включить его в подборку нельзя из-за уникальности. Это емкий ресурс по использованию XPM в архитектуре и строительстве. К сожалению, автор сайта больше его не обновляет, но в качестве шпаргалки страница годится до сих пор.
Вердикт
искусством и наукой о содействии и управлении потоком мыслей, эмоций и действий таким образом, чтобы получать максимальные результаты в сложных и нестабильных условиях.
Причины успеха XPM среди остальных методик менеджмента лежат в трех плоскостях:
- Extreme Project Management делает возможным непрерывную самокоррекцию и самосовершенствование в режиме реального времени;
- XPM фокусируется на определении и следовании миссии проекта , прививая уверенность стейкхолдерам и проектной команде;
- человеко-ориентированность , гуманизм и приоритет людей над процессами как ключевые особенности методологии.
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
1. Экстремальные системы управления
Экстремальные СУ - это такие САУ, в которых один из показателей качества работы нужно удерживать на предельном уровне (min или max).
Классическим примером экстремальной СУ является система автоподстройки частоты радиоприёмника.
Рис.1.1 - Амплитудно-частотная характеристика:
1.1 Постановка задачи синтеза экстремальных систем
Объекты описываются уравнениями:
Экстремальная характеристика дрейфует во времени.
Необходимо подобрать такое управляющее воздействие, которое позволяло бы автоматически находить экстремум и удерживать систему в этой точке.
U: extr Y=Y o (1.2)
Рис.1.2 - Статическая экстремальная характеристика:
Необходимо определить такое управляющее воздействие, которое обеспечило выполнение свойства:
1.2 Условие экстремума
Необходимое условие экстремума - равенство нулю первых частных производных.
Достаточное условие экстремума - равенство нулю вторых частных производных. При синтезе экстремальной системы необходимо оценить градиент, но вектор вторых частных производных оценить невозможно, и на практике, вместо достаточного условия экстремума используют соотношение:
Этапы синтеза экстремальной системы:
Оценка градиента.
Организация движения в соответствии с условием движение к экстремуму.
Стабилизация системы в точке экстремума.
Рис.1.3 - Функциональная схема экстремальной системы:
1.3 - Виды экстремальных характеристик
1) Унимодальная экстремальная характеристика типа модуля
Рис. 1.4 - Экстремальная характеристика типа модуля:
2) Экстремальная характеристика типа параболы
Рис. 1.5 - Экстремальная характеристика типа параболы:
3) В общем случае экстремальную характеристику можно описать параболой n-го порядка:
Y = k 1 |y-y o (t)| n + k 2 |y-y o (t)| n -1 + …+k n | y-y o (t)| + k n +1 (t).(1.9)
4) Векторно-матричное представление:
Y = y T By(1.10)
1.4 Способы оценки градиента
1.4.1 Способ деления производных
Рассмотрим его на унимодальной характеристике, y - выход динамический части системы.
yR 1 , Y = Y(y,t)
Найдём полную производную по времени:
При медленном дрейфе, таким образом
Достоинство: простота.
Недостаток: при малых 0 нельзя определить градиент.
Дифференцирующий фильтр.
Рис. 1.6 - Схема оценки частной производной:
1.4.2 Дискретная оценка градиента
Рис. 1.7 - Схема дискретной оценки частной производной:
1.4.3 Дискретная оценка знака градиента
При малом шаге дискретизации заменяем:
1.4.4 Метод синхронного детектирования
Метод синхронного детектирования предполагает добавление ко входному сигналу на экстремальный объект дополнительного синусоидального сигнала малой амплитуды, высокой частоты и выделение из выходного сигнала соответствующей составляющей. По соотношению фаз этих двух сигналов можно сделать вывод о знаке частных производных.
Рис. 1.8 - Функциональная схема оценки частной производной:
Рис. 1.9 - Иллюстрация прохождения поисковых колебаний на выход системы:
y 1 - рабочая точка, при этом разность фаз сигналов равна 0.
y 2 - разность фаз сигналов, в качестве простейшего ФЧУ можно использовать блок перемножения.
Рис. 1.10 - Иллюстрация работы ФЧУ:
В качестве фильтра выбирают усредняющий на периоде фильтр, который позволяет получить на выходе сигнал, пропорциональный значению частной производной.
Рис. 1.11 - Линеаризация статической характеристики в рабочей точке:
Следовательно уравнение экстремальной кривой можно заменить уравнением прямой:
Сигнал на выходе ФЧУ:
k - коэффициент пропорциональности - тангенс угла наклона прямой.
Сигнал на выходе фильтра:
Таким образом:
Метод синхронного детектирования годится для определения не только одной частной производной, но и градиента в целом, при этом на вход подаётся несколько колебаний различной частоты. Соответствующие фильтры на выходе выделяют реакцию на конкретный поисковый сигнал.
1.4.5 Специальный фильтр оценки градиента
Этот метод предполагает введение в систему специальную динамическую систему, промежуточный сигнал которой равен частной производной.
Рис. 1.12 - Схема специального фильтра оценки частной производной:
T- постоянная времени фильтра:
Для оценки полной производной Y используют ДФ - дифференцирующий фильтр, а затем эта оценка полной производной применяется для оценки градиента.
1.5 Организация движения к экстремуму
1.5.1 Системы первого порядка
Организуем закон управления пропорционально градиенту:
Запишем уравнение замкнутой системы:
Это обычное дифференциальное уравнение, которое можно исследовать методами ТАУ.
Рассмотрим уравнение статики системы:
Если с помощью коэффициента усиления k обеспечить устойчивость замкнутой системы, то автоматически в статике мы придём в точку экстремума.
В некоторых случаях с помощью коэффициента k можно кроме устойчивости обеспечить определённую длительность переходного процесса в замкнутой системе, т.е. обеспечить заданное время выхода на экстремум.
Где k - устойчивость
Рис. 1.13 - Функциональная схема градиентной экстремальной системы первого порядка:
Этот способ годится только для унимодальных систем, т.е. систем с одним глобальным экстремумом.
1.5.2 Метод тяжёлого шарика
По аналогии с шариком, который скатывается в овраг и проскакивает точки локальных экстремумов, система АУ с колебательными процессами также проскакивает локальные экстремумы. Для обеспечения колебательных процессов в систему первого порядка вводим дополнительную инерционность.
Рис. 1.14 - Иллюстрация метода “тяжёлого” шарика:
Уравнение замкнутой системы;
Характеристическое уравнение системы:
Чем меньше d тем длиннее переходный процесс.
Анализируя экстремальную характеристику, задаются необходимые перерегулирование и длительность переходного процесса, откуда задаются:
1.5.3 Одноканальные системы общего вида
Закон управления:
Подставив закон управления в управление объекта, получим уравнение замкнутой системы:
В общем случае, для анализа устойчивости замкнутой системы необходимо использовать второй метод Ляпунова, с помощью которого определяется коэффициент усиления регулятора. Т.к. 2 й метод Ляпунова даёт лишь достаточное условие устойчивости, то выбранная функция Ляпунова может оказаться неудачной и регулярную процедуру расчёта регулятора здесь предложить нельзя.
1.5.4 Системы со старшей производной в управлении
Общий случай экстремума объектов:
Функции f, B и g должны удовлетворять условиям существования и единственности решения дифференциального уравнения. Функция g - должна быть многократно дифференцируемой.
С - матрица производных
Задача синтеза разрешима, если матрица произведений будет не вырожденная, т.е.
Анализ условия разрешимости задачи синтеза позволяет определить производную выходных переменных, которая явно зависит от управляющего воздействия.
Если выполняется условие (1.31), то такой производной является первая производная, а следовательно требования к поведению замкнутой системы можно формировать в виде дифференциального уравнения для y, соответствующего порядка.
Сформируем закон управления замкнутой системы, для чего сформируем закон управления, подставив в правую часть управления для:
Уравнение замкнутой системы относительно выходной переменной.
Рассмотрим ситуацию, когда
При соответствующем выборе коэффициента усиления мы получаем желаемое уравнение и автоматический выход на экстремум.
Параметры регулятора выбираются из тех соображений, что и для обычных САУ, т.е. (СВК) i = (20*100), что позволяет обеспечить соответствующую ошибку.
Рис. 1.15 - Схема системы со старшей производной в управлении:
В системе для оценки полной производной по времени в систему вводят дифференцирующий фильтр, поэтому для оценки градиентов в таких системах удобно использовать фильтр оценки градиента. Т.к. оба этих фильтра имеют малые постоянные времени, то в системе могут возникать разнотемповые процессы, выделить которые можно с помощью метода разделения движений, причём медленные движения будут описываться уравнением (1.34), которое соответствует желаемому при. Быстрые движения нужно анализировать на устойчивость, причём в зависимости от соотношения постоянной времени ДФ и фильтра оценки частных производных (ФОЧП), можно выделить следующие виды движений:
1) Постоянные времени этих фильтров соизмеримы.
Быстрые движения описывают комбинированные процессы в этих двух фильтрах.
2) Постоянные времени различаются на порядок.
В системе наблюдаются кроме медленных движений, быстрые и сверх- быстрые движения, соответствующие наименьшей постоянной времени.
На устойчивость необходимо анализировать оба случая.
2. Оптимальные системы
Оптимальные системы - это системы, в которых заданное качество работы достигается за счет максимального использования возможностей объекта, иными словами это системы, в которых объект работает на пределе своих возможностей. Рассмотрим апериодическое звено первого порядка.
Для которого необходимо обеспечить минимальное время перехода у из начального состояния y(0) в конечное y k . Переходная функция такой системы при K=1 выглядит следующим образом
Рис. 2.1 - Переходная функция системы при U= const:
Рассмотрим ситуацию, когда на вход объекта подаем максимально возможное управляющее воздействие.
Рис. 2.2 - Переходная функция системы при U=A= const:
t 1 - минимально возможное время перехода y из нулевого состояния в конечное для данного объекта.
Для получения такого перехода существует два закона управления:
Второй закон более предпочтителен и позволяет обеспечить управление при помехах.
Рис. 2.3 - Структурная схема системы с законом управления типа обратной связи:
2.2 Постановка задачи синтеза оптимальных систем
2.2.1 Математическая модель объекта
Объект описан переменными состояния
Где функция f(x,u) непрерывна, дифференцируема по всем аргументам и удовлетворяет условию существования и единственности решения дифференциального уравнения.
Эта функция является нелинейной, но стационарной. В качестве частных случаев объект может иметь вид нелинейной системы с аддитивным управлением:
Либо линейной системой
Объект должен быть представлен в одной из трех форм, представленных выше.
2.2.2 Множество начальных и конечных состояний
Задача оптимального перехода из начального состояния в конечное представляет собой краевую задачу
Где начальные и конечные точки могут быть заданы одним из четырех способов, представленных на рис. 2.4.
а) задача с фиксированными концами,
б) задача с фиксированным первым концом (фиксированная начальная точка и множество конечных значений),
в) задача с фиксированным правым концом,
г) задача с подвижными концами.
Рис.2.4 - Фазовые портреты перехода системы из начального состояния в конечное для различных задач:
Для объекта множество начальных состояний может в общем случае совпадать с о всем множеством состояний либо с рабочей областью, а множество конечных состояний является подпространством множества состояний или рабочей области.
Пример 2.1 - В любую ли точку пространства состояний можно перевести объект, описываемый системой уравнений?
Подставив во второе уравнение значение U из первого уравнения u = x 2 0 - 2x 1 0 , получим -5x 1 0 + x 2 0 = 0;
Получили множество конечных состояний, описываемое уравнением x 2 0 = 5x 1 0 ;
Таким образом, множество конечных состояний, задаваемое для объекта (системы), должно быть реализуемым.
2.2.3 Ограничения на состояния и управление
Рис. 2.5 - Общий вид рабочей области пространства состояний:
Выделяется рабочая область пространства состояний, которая оговаривается. Как правило, эта область описывается ее границами с помощью модульных соглашений.
Рис.2.6 - Вид рабочей области пространства состояний, заданной модульными соглашениями:
Также задается U - область допустимых значений управляющего воздействия. На практике область U задается также с помощью модульных соотношений.
Задача синтеза оптимального регулятора решается при условии ограничений на управление и ограниченном ресурсе.
2.2.4 Критерий оптимальности
На этом этапе оговариваются требования, предъявляемые к качеству работы замкнутой системы. Требования задаются в обобщенном виде, а именно в виде интегрального функционала, который носит название критерия оптимальности.
Общий вид критерия оптимальности:
Частные виды критерия оптимальности:
1) критерий оптимальности, обеспечивающий минимум времени переходного процесса (решается задача оптимального быстродействия):
2) критерий оптимальности, обеспечивающий минимум затрат энергии:
По одной из компонент:
По всем переменным состояниям:
По одному управляющему воздействию:
По всем управляющим воздействиям:
По всем компонентам (в самом общем случае):
2.2.5 Форма результата
Необходимо оговорить в каком виде будем искать управляющее воздействие.
Возможны два варианта оптимального управления: u 0 = u 0 (t), используется при отсутствии возмущения, u 0 = u 0 (x), оптимальное управление в виде обратной связи (замкнутое управление).
Формулировка задачи синтеза оптимальной системы в общем виде:
Для объекта, описанного переменными состояниями с заданными ограничениями и множеством начальных и конечных состояний, необходимо найти управляющее воздействие, обеспечивающее качество процессов в замкнутой системе, соответствующее критерию оптимальности.
2.3 Метод динамического программирования
2.3.1 Принцип оптимальности
Исходные данные:
Необходимо найти u 0:
Рис. 2.7 - Фазовый портрет перехода системы из начальной точки в конечную в пространстве состояний:
Траектория перехода из начальной точки в конечную будет оптимальной и единственной.
Формулировка принципа: Конечный участок оптимальной траектории есть также оптимальная траектория. Если бы переход из промежуточной точки в конечную не осуществлялся бы по оптимальной траектории, то для него можно было бы найти свою оптимальную траекторию. Но в этом случае переход из начальной точки в конечную проходил бы по другой траектории, которая должна была бы быть оптимальной, а это невозможно, так как оптимальная траектория единственная.
2.3.2 Основное уравнение Беллмана
Рассмотрим объект управления произвольного вида:
Рассмотрим переход в пространстве состояний:
Рис. 2.8 - Фазовый портрет перехода системы из начальной точки в конечную x(t) - текущая (начальная) точка, x(t+Дt) - промежуточная точка.
Преобразуем выражение:
Заменим второй интеграл на V(x(t+Дt)):
При малом значении Дt введем допущения:
2) Разложим вспомогательную функцию
Выполняя дальнейшие преобразования, получим:
Где min V(x(t)) и есть критерий оптимальности J.
В результате получили:
Разделим обе части выражения на Дt и устраним Дt к нулю:
Получим основное уравнение Беллмана:
2.2.3 Расчетные соотношения метода динамического программирования:
Основное уравнение Белмана содержит (m+1) - неизвестных величин, т.к. U 0 R m , VR 1:
Продифференцировав m раз, получим систему из (m+1) уравнений.
Для ограниченного круга объектов решение полученной системы уравнений дает точное оптимальное управление. Такая задача носит название задачи АКОР (аналитического конструирования оптимальных регуляторов).
Объекты, для которых рассматривается задача АКОР, должны удовлетворять следующим требованиям:
Критерий оптимальности должен быть квадратичным:
Пример 2.2
Для объекта, описываемого уравнением:
Необходимо обеспечить переход из x(0) в x(T) по критерию оптимальности:
Проанализировав объект на устойчивость, получим:
U 0 = U 2 = -6x.
2.4 Принцип максимума Понтрягина
Введем расширенный вектор состояний, который расширяем за счет нулевой компоненты, в качестве которой выбираем критерий оптимальности. zR n+1
Также введем расширенный вектор правых частей, который расширяем за счет функции, стоящей под интегралом в критерии оптимальности.
Введем Ш - вектор сопряженных координат:
Сформируем Гамильтониан, представляющий собой скалярное произведение Ш и ц(z,u):
H(Ш,z,u) = Ш*ц(z,u),(2.33)
Уравнение (2.34) называется основным уравнением принципа максимума Понтрягина, основанное на уравнении динамического программирования. Оптимальным является управление, которое на заданном интервале времени доставляет максимум Гамильтониана. Если бы ресурс управления не был бы ограничен, то для определения оптимального управления можно было бы воспользоваться необходимыми и достаточными условиями экстремума. В реальной ситуации для отыскания оптимального управления необходимо анализировать величину Гамильтониана при предельном значении уровня. В этом случае U 0 будет функцией расширенного вектора состояний и вектора сопряженных координат u 0 = u 0 .
Для отыскания сопряженных координат необходимо решить систему уравнений:
2.4.1 Процедура расчета системы по принципу максимума Понтрягина.
Уравнения объекта должны быть приведены к виду, стандартному для синтеза оптимальных систем:
Необходимо оговорить также начальные и конечные состояния и записать критерий оптимальности.
Вводятся расширенный вектор состояний
Расширенный вектор правых частей:
И вектор сопряженных координат:
Записываем Гамильтониан как скалярное произведение:
Находим максимум Гамильтониана по u:
По которому определяем оптимальное управление u 0 (Ш,z).
Записываем дифференциальные уравнения для вектора сопряженных координат:
Находим сопряженные координаты как функцию времени:
6. Определяем окончательный оптимальный закон управления:
Как правило, этот способ позволяет получить программный закон управления.
Пример 2.3 - Для объекта, представленного на рис. 2. 9. необходимо обеспечить переход из начальной точки y(t) в конечную y(t) за T= 1c с качеством процесса:
Рис. 2.9 - Модель объекта:
Для определения констант b 1 и b 2 нужно решить краевую задачу.
Запишем уравнение замкнутой системы
Проинтегрируем:
Рассмотрим конечную точку t=T=1с., как x 1 (T)=1 и x 2 (T)=0:
1= 1/6 b 1 + 1/2 b 2
Получили систему уравнений, из которой находим b 2 = 6, b 1 = -12.
Запишем закон управления u 0 = -12t + 6.
2.4.2 Задача оптимального управления
Для объекта общего вида необходимо обеспечить переход из начальной точки в конечную за минимальное время при ограниченном законе управления.
Особенности задачи оптимального быстродействия
Гамильтониан быстродействия:
Релейность управления:
Эта особенность имеет место для релейных объектов.
Теорема о числе переключений управляющего воздействия:
Эта теорема справедлива для линейных моделей с вещественными корнями характеристического уравнения.
Det (pI - A) =0 (2.51)
Л(A) - вектор вещественных собственных чисел.
Формулировка теоремы:
В задаче оптимального быстродействия с вещественными корнями характеристического уравнения число переключений не может быть больше, чем (n-1), где n - порядок объекта, следовательно, число интервалов постоянства управления не будет больше, чем (n-1).
Рис. 2.10 - Вид управляющего воздействия при n=3:
Пример 2.4 - Рассмотрим пример решения задачи оптимального быстродействия:
Ш=[Ш 1 , Ш 2 ]
H б = Ш 1 x 2 + Ш 2 (-2dx 2 -x 1 +u)
При - корни вещественные:
Сумма двух экспонент представляет собой:
Если, то корни комплексно-сопряженные и решение будет представлять собой периодическую функцию. В реальной системе, переключений не более 5 - 6.
2.4.3 Метод поверхности переключений
Данный метод позволяет найти управление функций переменной состояния для случая когда оптимальное управление носит релейный характер. Таким образом этот метод можно применять при решении задач оптимального быстродействия, для объекта с аддитивным управлением
Суть метода заключается в том, чтобы во всём пространстве состояний выделить точки, где происходит смена знака управления и объединить их в общую поверхность переключений.
Поверхность переключений
Закон управления будет иметь следующий вид:
Для формирования поверхности переключений удобнее рассматривать переход из произвольной начальной точки в начало координат
Если конечная точка не совпадает с началом координат, то необходимо выбрать новые переменные, для которых это условие будет справедливо.
Имеем объект вида
Рассматриваем переход, с критерием оптимальности:
Этот критерий позволяет найти закон управления такого вида:
С неизвестным, начальные условия нам также неизвестны.
Рассматриваем переход:
Метод обратного времени (метод попятного движения).
Этот метод позволяет определить поверхности переключений.
Суть метода заключается в том, что начальная и конечная точки меняются местами, при этом вместо двух совокупностей начальных условий остаётся одна для.
Каждая из этих траекторий будет оптимальна. Сначала находим точки, где управление меняет знак и объединяем их в поверхность, а затем направление движения меняем на противоположное.
Пример - Передаточная функция объекта имеет вид:
Критерий оптимальности быстродействия:
Ограничение на управление.
Рассмотрим переход:
Оптимальное управление будет иметь релейный характер:
Перейдём в обратное время (т.е.). В обратном времени задача будет иметь такой вид
Рассмотрим два случая:
Получим уравнения замкнутой системы:
Воспользуемся методом непосредственного интегрирования, получим зависимость от и поскольку -, то имеем
Т.к. начальные и конечные точки поменяли местами, то, получим аналогично:
Построим получившееся и по методу фазовой плоскости определим направление
Применив метод непосредственного интегрирования, получим:
Функция будет иметь вид:
Изменив направление:
Точка смены знака (точка переключения).
Общее аналитическое выражение:
Уравнение поверхности:
Оптимальный закон управления:
Подставив уравнение поверхности, получим:
2.5 Субоптимальные системы
Субоптимальные системы - это системы близкие по свойствам к оптимальным
Характеризуется критерием оптимальности.
Абсолютная погрешность.
Относительная погрешность.
Субоптимальным называют процесс близкий к оптимальному с заданной точностью.
Субоптимальная система - система где есть хоть один субоптимальный процесс.
Субоптимальные системы получаются в следующих случаях:
при аппроксимации поверхности переключений (с помощью кусочно-линейной аппроксимации, аппроксимация с помощью сплайнов)
При в субоптимальной системе будет возникать оптимальный процесс.
ограничение рабочей области пространства состояний;
3. АДАПТИВНЫЕ СИСТЕМЫ
3.1 Основные понятия
Адаптивными системами называют такие системы, в которых параметры регулятора меняются вслед за изменением параметров объекта, таким образом, чтобы поведение системы в целом оставалось неизменным и соответствовало желаемому:
Существует два направления в теории адаптивных систем:
адаптивные системы с эталонной моделью (АСЭМ);
адаптивные системы с идентификатором (АСИ).
3.2 Адаптивные системы с идентификатором
Идентификатор - устройство оценки параметров объекта (оценка параметров должна осуществляться в реальном времени).
АР - адаптивный регулятор
ОУ - объект управления
U - идентификатор
Часть, которая выделена пунктиром, может быть реализована в цифровом виде:
V, U, X - могут быть векторы. Объект может быть многоканальным.
Рассмотрим работу системы.
В случае неизменных параметров объекта, структура и параметры адаптивного регулятора не меняются, действует главная обратная связь, сис-тема представляет собой систему стабилизации.
Если параметры объекта меняются, то они оцениваются идентификато-ром в реальном времени и происходит изменение структуры и параметров адаптивного регулятора так, чтобы поведение системы оставалось неизмен-ным. Основные требования предъявляются к идентификатору (быстродействие и т.д.) и к самому алгоритму идентификации. Такой класс систем используют для управления объектами с медленными нестационарностями. Если мы имеем нестационарный объект общего вида:
;.Простейший адаптивный вид будет следующий:
Требования, которые предъявляются к системе:
Где и - матрицы постоянных коэффициентов.
Реально мы имеем:
Если приравнять, то получим соотношение для определения параметров регулятора
3.3 Адаптивные системы с эталонной моделью
В таких системах существует эталонная модель (ЭМ), которая ставится параллельно объекту. БА - блок адаптации.
Рис 2 - Функциональная схема АСЭМ:
Рассмотрим работу системы:
В том случае, когда параметры объекта не меняются или процессы на выходе соответствуют эталонным, ошибка:
автоподстройка управление программирование
Не работает блок адаптации и не перестраивается адаптивный регулятор, в системе действует плавная обратная связь.
Если поведение отлично от эталонного, это происходит при изменении параметров объекта, в этом случае появляется ошибка.
Включается блок адаптации, перестраивается структура адаптивного регулятора, таким образом чтобы свести к эталонной модели объекта.
Блок адаптации должен сводить ошибку к нулю ().
Алгоритм, закладываемый в блок адаптации, формируется различными способами, например, с использованием второго метода Ляпунова:
Если это будет выполняться, то система будет асимптотически устойчива и.
Размещено на Allbest.ru
...Подобные документы
Постановка задачи синтеза системы управления. Применение принципа Максимума Понтрягина. Метод аналитического конструирования оптимальных регуляторов. Метод динамического программирования Беллмана. Генетическое программирование и грамматическая эволюция.
дипломная работа , добавлен 17.09.2013
Методы решения задачи синтеза системы управления динамическим объектом. Сравнительная характеристика параметрического и структурно-параметрического синтеза. Схема процесса символьной регрессии. Принцип действия метода аналитического программирования.
дипломная работа , добавлен 23.09.2013
Понятие большой системы управления. Модель структурного сопряжения элементов. Организация многоуровневой структуры управления. Общая задача линейного программирования. Элементы динамического программирования. Постановка задачи структурного синтеза.
учебное пособие , добавлен 24.06.2009
Постановка задачи динамического программирования. Поведение динамической системы как функция начального состояния. Математическая формулировка задачи оптимального управления. Метод динамического программирования. Дискретная форма вариационной задачи.
реферат , добавлен 29.09.2008
Исследование основных динамических характеристик предприятия по заданному каналу управления, результаты которого достаточны для синтеза управляющей системы (СУ). Построение математической модели объекта управления. Анализ частотных характеристик СУ.
курсовая работа , добавлен 14.07.2012
Теория автоматического управления. Передаточная функция системы по ее структурной схеме. Структурная схема и передаточная функция непрерывной САР. Устойчивость системы. Исследование переходного процесса. Расчет и построение частотных характеристик.
курсовая работа , добавлен 14.03.2009
Общие понятия и классификация локальных систем управления. Математические модели объекта управления ЛСУ. Методы линеаризации нелинейных уравнений объектов управления. Порядок синтеза ЛСУ. Переходные процессы с помощью импульсных переходных функций.
курс лекций , добавлен 09.03.2012
Принцип работы и задачи информационных систем управления проектами. Методы критического пути, анализа и оценки планов. Сетевые модель и график, виды путей. Информационный обмен между предприятиями, классификация информационных систем и их рынки сбыта.
контрольная работа , добавлен 18.11.2009
Классификация информации по разным признакам. Этапы развития информационных систем. Информационные технологии и системы управления. Уровни процесса управления. Методы структурного проектирования. Методология функционального моделирования IDEF0.
курсовая работа , добавлен 20.04.2011
Анализ основных этапов решения задачи синтеза регуляторов в классе линейных стационарных систем. Нахождение оптимальных настроек регулятора и передаточной функции замкнутой системы. Изучение состава и структуры системы автоматизированного управления.
Настройка (экстремальное управление)
Экстремальное управление получило такое название от специфической цели этого управления. Задача экстремального управления заключается в достижении экстремальной цели, т. е. в экстремизации (минимизации или максимизации) некоторого показателя объекта, значение которого зависит от управляемых и неуправляемых параметров объекта. К экстремальному управлению приводит очень распространенная операция настройки.
Всякая настройка заключается в построении такой системы действий, которые обеспечивают наилучший режим работы настраиваемого объекта. Для этого необходимо уметь различать состояния объекта и квалифицировать эти состояния так, чтобы знать, какое из двух состояний следует считать «лучше» другого. Это означает, что в процессе настройки должна быть определена мера качества настройки.
Например, при настройке технологического процесса показателем его качества может служить число бракованных деталей в партии; в этом случае задача настройки процесса заключается в том, чтобы минимизировать брак. Однако далеко не все экстремальные объекты допускают столь простое количественное представление показателя качества настройки. Так, например, при настройке радиоприемников или телевизоров такими мерами качества настройки могут служить качество звучания и качество
изображения принимаемой передачи. Здесь уже довольно сложно определить показатель качества настройки в количественной форме. Однако, как будет показано ниже, для решения задач экстремального управления часто важно знать не абсолютное значение показателя качества, а знак его приращения в процессе управления. Это означает, что для управления достаточно знать, увеличился или уменьшился показатель качества. В случае настройки радиоаппаратуры человек довольно хорошо решает эту задачу, если речь идет о качестве звучания или изображения.
Рис. 1.3.1.
Таким образом, в дальнейшем предполагается, что всегда существует такой алгоритм переработки информации настраиваемого объекта, который позволяет количественно определись качество настройки этого объекта (или знак изменения этого качества в процессе управления). Качество настройки измеряется числом Q , которое зависит от состояния управляемых параметров объекта:
. (1.3.1)
Целью настройки является экстремизация этого показателя, т. е. решение задачи
где буквой S обозначена область допустимого изменения управляемых параметров.
На рис. 1.3.1 показана блок-схема экстремального объекта. Он образуется из собственно объекта настройки с управляемыми входами и наблюдаемыми выходами, которые несут информацию о состоянии объекта, и преобразователя, который на основе полученных сведений образует скалярный показатель качества объекта.
Примером экстремального объекта может служить радиоприемник в процессе поиска станции. Если слышимость станции уменьшается (как говорят, станция «уплывает»), то для получения наилучшего звучания передачи, т. е. для настройки приемника, необходимо подстроить контур. Управление настройкой в данном случае заключается в определении направления вращения рукоятки настройки. Уровень слышимости станции здесь является показателем качества настройки. Он не несет необходимой
Рис. 1.3.2.
информации об управлении, т. е. не указывает, в каком направлении следует вращать рукоятку настройки. Поэтому для получения необходимой информации вводится поиск -- пробное движение рукоятки настройки в произвольном направлении, что дает дополнительную и необходимую информацию для настройки. После этого уже можно точно сказать, в каком направлении следует крутить рукоятку: если слышимость уменьшилась, нужно крутить в обратном направлении, если уже увеличилась, следует вращать ручку настройки туда же до максимума слышимости. Такой простейший алгоритм поиска, применяемый при настройки радиоприемника, который является типичным примером экстремального объекта.
Таким образом, объекты экстремального управления отличаются недостаточностью информации на выходе объекта, наличием своеобразного информационного «голода». Для получения необходимой информации в процессе управления экстремальными объектами необходимо ввести поиск в виде специально организованных пробных шагов. Процесс поиска отличает настройку и экстремальное управление от всех других видов управления.
В качестве более «серьезного» примера однопараметрического экстремального объекта рассмотрим задачу об оптимальном демпфировании следящей системы второго порядка (рис. 1,3.2). На вход этой следящей системы подается задающее возмущение у* (t), определяющее состояние выхода у (t). Относительно характера поведения у* (t) ничего не известно. Более того, статистические свойства возмущения у* (t) могут изменяться непредвиденным образом.
Рис. 1.3.3.
Задача настройки заключается в выборе такого демпфирования о которое делает эту следящую систему оптимальной в смысле минимума функционала:
Величина Q является оценкой дисперсии невязки о(t)=y(t)-y*(t) на базе Т . Очевидно, что при настройке следящей системы следует добиваться минимизации величины Q.
Здесь в качестве объекта настройки выступает указанная следящая система, выходной информацией для определения качества работы объекта являются его вход и выход, а преобразователь образует показатель качества по формуле (1.3.3). Полученный экстремальный объект имеет характеристику, показанную на рис. 1.3.3. Характер зависимости Q (о ) выражает тот очевидный факт, что малое демпфирование столь же плохо, как и слишком большое. Как видно, характеристика (1.3.3) имеет ярко выраженный экстремальный характер с минимумом, соответствующим оптимальному демпфированию о *. Кроме того, характеристика зависит от свойств возмущения у* (t). Следовательно, оптимальное состояние о*, минимизирующее Q (о ), также зависит от характера задающего возмущения y*(t) и изменяется вместе с ним. Это и заставляет обратиться к созданию специальных систем автоматической настройки, поддерживающих объект в настроенном (экстремальном) состоянии независимо от свойств возмущений. Эта автоматические приборы, решающие задачу настройки, носят название экстремальных регуляторов или оптимизаторов (т. е. приборов для оптимизации объекта).
Отличительной особенностью экстремальных объектов является немонотонность (экстремальность) характеристики, что приводит к невозможности воспользоваться методом регулирования в целях управления подобными объектами. Действительно, наблюдая выходное значение Q объекта в рассмотренном выше примере (см. рис. 1.3.3), нельзя построить управление, т. е. определить, в каком направлении следует изменить управляемый параметр о. Эта неопределенность связана, прежде всего, с возможностью двух ситуаций и, выход из которых к цели о* производится прямо противоположным образом (в первом случае следует увеличивать о, а во втором -- уменьшать). Прежде чем управлять таким объектом, необходимо получить дополнительную информацию -- в данном примере эта информация заключается в определении, на какой ветви характеристики находится объект. Для этого, например, достаточно определить значение показателя качества в соседней точке о + ? о, где? о -- достаточно малое отклонение.
Следует отметить, что автоматизация процесса настройки оправдана лишь в том случае, если экстремальная характеристика объекта изменяется во времени, т. е. при блуждании экстремального состояния. Если же характеристика объекта не изменяется, то процесс поиска экстремума имеет однократный характер и, следовательно, не нуждается в автоматизации (достаточно стабилизировать объект в однажды определенном экстремальном состоянии).
На рис. 1.3.4 для иллюстрации показана блок-схема экстремального управления демпфированием следящей системы, отслеживающей положение цели у (t), характер поведения которой изменяется.
Рис. 1.3.4.
Здесь экстремальный регулятор решает задачу настройки, т. е. поддерживает такое значение демпфирования о , которое минимизирует показатель качества следящей системы.