[RATINGS]
Почему альтернативные методы синтеза регуляторов дают разные результаты и как это исправить?
Фитерман Михаил Яковлевич, к.т.н., с.н.с.
ОАО «РУСАЛ ВАМИ», г. Санкт-Петербург
В теории синтеза оптимальных законов управления для задач стабилизации существует два идеологически и математически различных подхода – метод передаточных функций (операторный подход или классическая ТАУ) и метод пространства состояний (подход в пространственно-временной области или современная ТАУ). Системы управления, синтезированные этими теоретическими аппаратами, иногда оказываются различными, не только по характеристикам, но и по структуре. Это – проверенный практикой факт и этот факт заслуженно вызывает обеспокоенность ученых и специалистов. Глубинные причины такого расхождения пока не выявлены или, по меньшей мере, не опубликованы. Попытка объяснения этого феномена предпринята в работе проф. Ротача В. Я. «Теория автоматического управления: соответствуют ли ее основные положения действительности?»/Промышленные АСУ и контроллеры. №3, 2007 [1]. В этой работе есть рекомендации, как скорректировать теорию. Но нет объяснения причин расхождения, без чего данные рекомендации выглядят эфемерными.
Прежде всего, напомним принципиальные различия сравниваемых теоретических инструментов оптимального синтеза. Операторный подход, т. е. метод передаточных функций, игнорирует глобальный закон природы: в причинно-следственных связях причина не может возникнуть раньше следствия. Иначе говоря, причинно-следственные связи всегда однонаправлены во времени – от настоящего к будущему. В теории управления это еще формулируют как физическая реализуемость динамических связей. В этом законе главное – категория времени, а именно эта категория отсутствует в аппарате передаточных функций. В аппарате же пространства состояния эта категория – основная: координаты пространства состояния рассматриваются как функции времени. Это главное преимущество метода анализа и синтеза в пространстве состояния. Второе преимущество – универсальность результатов для объектов любой связности и размерности пространства состояния за счет применения векторного описания объектов и систем. В этом теоретическом аппарате учет указанного главного закона физически наглядно проявляется в описании элементов системы управления в дискретном времени. Понятно, что реальные объекты управления, как творения природы, подчиняются физическим законам в непрерывном времени, но управляющие устройства, как рукотворные изделия (современные цифровые регуляторы), функционируют и описываются в дискретном времени. Поэтому естественно преобразовывать модель объекта в дискретное время. При этом производная по времени, как предельный переход, трансформируется в конечное приращение. В результате, дифференциальные уравнения, описывающие процессы в непрерывном времени, заменяются разностными уравнениями. А сам механизм вычислений разностных уравнений – определение величины для следующего дискретного момента времени через ее значение в текущий момент времени (и возможно, предыдущие моменты) – как раз и реализует однонаправленность причинно-следственных связей.
Но классический метод передаточных функций не уступает так уж просто современному методу пространства состояния. Существуют приемы анализа и синтеза в операторном пространстве, позволяющие учесть физическую реализуемость, правда, в косвенном виде, опосредованно. В итоге, большинство разработчиков промышленных стабилизирующих систем, главным образом односвязных, сегодня предпочитают пользоваться аппаратом передаточных функций. В этом, по-видимому, проявляется естественная человеческая консервативность и скептическое отношение к новейшей теории. Именно поэтому очень важно объяснить, а затем проанализировать и исключить причины расхождения этих альтернативных подходов.
Утверждение 1. Различие указанных теоретических методов объясняется рассмотрением объекта управления в разных системах координат. Обоснуем это утверждение. Модель объекта, исходно записанная в операторной форме и затем преобразованная в дифференциальные уравнения путем замены оператора p на производную по времени, описывается в естественной системе координат: отклонение x управляемой величины от задания и его производные dx/dt, d2x/dt2,…,dnx/dtn. Назовем такую форму описания объекта в пространстве состояния естественной и обозначим вектор состояния в естественной системе координат через X=[x, dx/dt,…,dnx/dtn}. Но, при попытке векторного описания этой модели в терминах вектора состояния X возникает следующая трудность. В исходное дифференциальное уравнение объекта могут входить не только само управление U, но и его производные порядка до n включительно. Что касается производных управляемой величины x, то они, как известно, взаимно независимы (в рамках модели объекта). Это и позволяет группировать их в вектор состояния X с независимыми компонентами. Производные же от управления вычисляются в самом регуляторе (в соответствии с его алгоритмом), т. е. формируются искусственно и не являются следствием физических закономерностей. Поэтому эти производные не являются взаимно независимыми и их нельзя сгруппировать в вектор управления, т. е. управление остается скалярной величиной. Казалось бы, невозможно записать модель объекта в виде векторного уравнения, в котором фигурировало бы только управление, без его производных. К счастью, в арсенале теории векторного пространства состояния имеются приемы, позволяющие получить векторное уравнение объекта, не включающее производных управления. Один из таких приемов приведен в [2]. Но этот и другие возможные приемы преобразования дифференциального уравнения объекта (или системы уравнений для связанных объектов многосвязной системы) к векторному дифференциальному уравнению приводят к тому, что системы координат обоих описаний объекта не совпадают. Оказывается, что для возможности векторного описания объекта без производных управления приходится преобразовывать естественную систему координат. Обозначим вектор состояния в преобразованной системе координат через Z={Z1,Z2,…,Zn}. Векторное описание объекта в преобразованной системе координат называется нормальной формой описания. Доказано, что обе формы описания объекта – естественная и нормальная эквивалентны в смысле совпадения решений их уравнений при идентичных входных воздействиях [2]. Связь между преобразованными и естественными координатами получается сопоставлением обеих форм описания объекта. Оказывается, что каждая координата преобразованной системы Zi связана только с одноименной естественной координатой Xi. Но в этих связях могут присутствовать дополнительные аддитивные добавки в виде линейных комбинаций управления и его производных. Можно образно сказать, что эти добавки – есть плата за исключение производных управления из векторного уравнения нормальной формы.
Итак, обе формы описания объекта эквивалентны, хотя и записываются в разных системах координат. Отсюда вытекает следующее
Утверждение 2. Результат синтеза оптимального закона управления в пространстве естественной системы координат и показатели качества замкнутой системы совпадают с таковыми для синтеза оптимального закона управления в преобразованной системе координат после его перевода (перекодировки) в исходную, естественную систему координат.
Справедливость этого утверждения не очевидна в силу того, что критерии качества управления в разных системах координат не обязательно эквивалентны.
Следовательно, для идентичности результатов синтеза оптимального управления по обоим альтернативным теоретическим аппаратам, необходимо в процедуре синтеза в векторном пространстве состояния (в нормальной форме описания объекта) задать критерий оптимальности, который будет эквивалентен критерию, принятому в естественной системе координат. Это можно обеспечить двумя способами:
Способ 1. Этот способ предполагает непосредственное перекодирование критерия, сформулированного в пространстве X, в пространство Z, а затем синтез в пространстве Z.
Cпособ 2. Этот способ предполагает введение в рассмотрение промежуточного управления U’, равного линейной комбинации управления U и его производных dU/dt, d2U/dt2,…,dnU/dtn, которые фигурируют в правой части уравнения объекта в естественной форме. Такая форма описания уравнения объекта называется уравнением Фробениуса. По этому способу системы координат пространств X и Z оказываются идентичными и это – важное достоинство метода синтеза в такой векторной форме описания объекта. Недостаток же заключается в том, что оптимально синтезируется промежуточное управление U’, а окончательное управление U еще нужно по нему вычислять.
На рис. 1 показаны схемы замкнутой системы, синтезируемой каждым из указанных способов в пространстве состояния.
Рис. 1. Схемы замкнутой системы, синтезированной по способам 1) и 2).
В обоих вариантах схемы синтез управления в Z производится методами пространства состояния. Во втором варианте закон управления блока «синтез U’ в Z» представляет собой линейную функцию от Z, а значит и от X. Например, для объекта 3-го порядка «синтез U’ в Z» представляет собой ПИД-регулятор.
Способ 1 рекомендуется в учебной литературе (см., например, [3]). Но, как мы выяснили, по этому способу необходимо переформулировать критерий оптимальности (иначе результаты синтеза могут отличаться от оптимизации с естественной формой модели объекта). Способ 2 этого не требует, но необходимо вычисление окончательного управления U через промежуточное U’ по уравнению динамического звена (это – правая часть исходного уравнения объекта в естественной форме). Нам представляется, что итоговая процедура по второму способу логически и вычислительно проще.
Рассмотрим пример синтеза для односвязного объекта 3-го порядка с координатами состояния {x, dx/dt, d2x/dt2} по второму способу синтеза в пространстве состояния. В практике обычно применяют регуляторы с интегральной составляющей, т. е. рассматривают систему координат {∫x, x, dx/dt}. Уравнение объекта в естественной системе координат с вектором X={X1, X2, X3}≡{∫x, x, dx/dt} имеет вид:
(1)…..d2x/dt2+a3*dx/dt+a2*x+a1*∫x=b2*dU/dt+b1*U+h,
где h – входное возмущение.
Это уравнение в нормальной векторной форме принимает вид:
(2)…..dX/dt=A*X+B*(U’+h),
(3)….. b2*dU/dt+b1*U=U’.
Здесь матрицы A, B имеют специальный вид (в форме Фробениуса):
Для синтеза управления преобразуем модель (2), (3) к дискретному времени. Получим:
(5)…..X(t+1)=A*X(t)+B*(U’(t+1)+h(t+1)),
(6)…..U(t+1)=(1-b1/b2)U(t)+1/b2*U’(t+1).
Здесь матрицы модели A, B для дискретного времени отличаются от таковых для непрерывного времени, но в нашем примере их конкретные значения не используются и поэтому они обозначены теми же буквами. В качестве критерия оптимальности примем целевую функцию J в виде взвешенной квадратичной ошибки компонент вектора X(t+1) на следующем шаге управления t+1. Эта функция должна минимизироваться по управлению U’(t+1) при прогнозе возмущения h(t+1) (для случая белого шума h(t+1)=0):
(7)…..J=X(t+1)t*Q*X(t+1)=(A*X(t)+B*U’(t+1))t*Q*(A*X(t)+B*U’(t+1))→min по U’(t+1).
Здесь Q – матрица выбранных весовых коэффициентов для координат состояния. В простейшем случае принимают Q22=1, а остальные компоненты матрицы Q нулевые. При этом учитывается ошибка только главной координаты X2=x. Дифференцируя J по U’(t+1) и приравнивая нулю, находим:
(8)…..U’(t+1)=-R*AX(t), R=(Bt*Q*B)-1*Bt*Q,
где R – постоянный векторный коэффициент регулятора.
Таким образом, получен оптимальный закон управления по выбранному критерию. Далее, окончательное управление U(t+1) находится по (6). Из примера видно, что, если коэффициент b2→0, то управление представляет собой ПИД- закон. Если же b2≠0, то такой регулятор описывается дробно-рациональной передаточной функцией. Чаще всего именно в этом проявляется отличие законов управления, синтезированных методом передаточных функций и методом пространства состояний. Действительно, если в качестве окончательного управления принять U’ по (8), а пересчет по (6) проигнорировать, то расхождение налицо.
Литература.
- Ротач В. Я. Теория автоматического управления: соответствуют ли ее основные положения действительности?/Ж.: Промышленные АСУ и контроллеры. №3, 2007.
- Первозванский А. А. Курс теории автоматического управления. М.: Наука, 1986.
- «Справочник по теории автоматического управления» под ред. А.А. Красовского А. А., М.:, Наука, 1987.

- Blink
- del.ici.ous
- Digg
- Furl
- Simpy
- Spurl
- Y! MyWeb
- БобрДобр
- Мистер Вонг
- Яндекс.Закладки
- Текст 2.0
- News2
- AddScoop
- RuSpace
- RUmarkz
- Memori
- Закладки Google
- Писали
- СМИ 2
- Моё Место
- Сто Закладок
- Ваау!
- Technorati
- RuCity
- LinkStore
- NewsLand
- Lopas
- Закладки - I.UA
- Connotea
- Bibsonomy
- Trucking Bookmarks
- Communizm
- UCA
Эта запись была опубликована 03.08.2007в 9:25 пп. В рубриках: ПИД закон, АСУ, Моделирование, Все статьи. Вы можете следить за ответами к этой записи через RSS 2.0. Вы можете оставить свой отзыв или трекбек со своего сайта.