[RATINGS]

АДАПТИВНАЯ НАСТРОЙКА РЕГУЛЯТОРОВ АСР

Фитерман Михаил Яковлевич, к.т.н., с.н.с.

ОАО «РУСАЛ ВАМИ», г. Санкт-Петербург

28. 06. 2007г.

Введение

На современном этапе автоматизации технологических процессов в промышленности теория и практика достигла уровня, когда для создания промышленных систем автоматического регулирования (АСУТП) не требуется ни математическое описание, ни синтез оптимальных алгоритмов стабилизации, а создание АСУТП является почти рутинной процедурой. Но такая универсальность и стандартизация не исключает и не может исключить уникальность конкретных технологических объектов управления. Эта уникальность лишь перевоплотилась в проблему экспериментального определения характеристик конкретных объектов, т. е. в проблему экспериментальной настройки регуляторов. Существующие методы настройки регуляторов, по сути, не изменились и предполагают специально организуемое искусственное возбуждение объекта регулирования. Необходимость искусственных воздействий на объект обусловлена наличием контура обратной связи системы регулирования, что затрудняет экспериментальное определение характеристик объекта в условиях нормальной эксплуатации, а разрывать этот контур достаточно длительно или часто чревато заметным ущербом в качестве регулирования. По этой причине настройка промышленных регуляторов часто производится вручную, без применения специально созданных программно-технических средств настройки. Таким образом, в проблеме автоматизации настройки промышленных регуляторов возникает порочный круг в виде принципиальной трудности экспериментального определения параметров объекта в режиме нормальной эксплуатации в контуре с обратной связью. В данной работе показано, что этот порочный круг можно разорвать путем идентификации не отдельно объекта, а всего контура регулирования, как единого целого, и аналитически найти оптимальные настройки регулятора по результатам такой идентификации. Для этого потребовалась лишь одна догадка.

1. Постановка задачи настройки регулятора

Рассмотрим односвязные объекты регулирования (с одним регулируемым и одним регулирующим переменными) и определим класс и множество таких объектов по признаку удовлетворительного регулирования их данным типом стандартного промышленного регулятора. Под удовлетворительным регулированием понимается качественное понятие приемлемой точности стабилизации при оптимально настроенном регуляторе данного типа (например, ПИ или ПИД-регулятор). Среди линейных моделей односвязных объектов определяющим признаком класса является число координат состояния, учитываемых регулятором: интегральная, пропорциональная, дифференциальная и т. д.. Как известно, регулятор заданного n-го порядка может быть настроен строго оптимально для линейного объекта этого же порядка с входным возмущением типа белого шума [1]. Поэтому естественно назвать такой линейный объект идеалом данного класса порядка n. Не оптимально, но удовлетворительно регулироваться регулятором данного класса могут объекты и более низкого или высокого порядка. Кроме того, многие объекты с автокоррелированным возмущением или чистым (транспортным) запаздыванием в канале управления так же удовлетворительно регулируются стандартными линейными регуляторами. Но такие объекты всегда можно привести к линейной модели в пространстве состояния более высокого (в пределе бесконечного) порядка. Действительно, если для объекта с автокоррелированным возмущением смоделировать это возмущение из белого шума с соответствующим формирующим фильтром и добавить этот фильтр в модель объекта, то получим объект более высокого порядка с белым шумом на входе. Аналогично, если аппроксимировать чистое запаздывание в виде цепочки инерционных звеньев первого порядка, то также получим объект более высокого порядка с белым шумом. Вся совокупность указанных объектов и составляет множество объектов данного класса с центром в виде идеала этого класса. Вспомним известный практический факт: подавляющее большинство промышленных односвязных объектов удовлетворительно регулируются ПИ или ПИД-регуляторами, т. е. относятся к классу 2-го или 3-го порядка.Вывод алгоритма настройки регулятора класса n проведем для идеального объекта данного класса. Для унификации удобно записать модель такого объекта в пространстве состояний в векторной форме и в дискретном времени. Такая модель имеет следующий общий вид:
(1)…..X(t)=A*X(t-1)+B*U(t)+h(t).

Здесь X, h – n-мерные векторы состояния и дискретного белого шума, U – скалярное управление, A, B – n*n и n*1 – мерные матричные коэффициенты. Например, для ПИД-регулятора (n=3) первая компонента X1 вектора X – есть интегральная составляющая отклонения регулируемой величины, вторая компонента X2 – само отклонение, третья компонента X3 – первая производная отклонения.Далее, оптимальный закон регулирования по минимуму среднеквадратичной ошибки, т. е. по минимуму квадратичной формы X(t)t*Q*X(t), где Q – n*n-мерная не отрицательно определенная весовая матрица, имеет известный вид [1]:

(2)…..U(t)=-Rt*A*X(t-1),где R=Q*B*(Bt*B)-1

— n-мерный векторный коэффициент передачи регулятора, t – символ транспонирования.

2. Алгоритм настройки регулятора

Для целей настройки регулятора запишем закон регулирования в виде линейной комбинации настроечных констант – вектор-строки K и вектора состояния X(t-1):(3)…..U(t)=-K*X(t-1).При этом из сравнения выражений (2) и (3) находим, что результатом настройки регулятора должен быть оптимальный вектор констант Kopt:

(4)…..Kopt=RtA.

Из уравнений (1), (3) исключим управление и получим уравнение замкнутого контура регулирования:

(5)…..X(t)=(A-B*K)*X(t-1)+h(t).

Здесь фигурирует единственная матрица коэффициентов контура регулирования (A-B*K). Эта матрица констант может быть найдена идентификацией полученного уравнения контура. Как видно из этого уравнения и известно из теории, в замкнутом контуре невозможно идентифицировать раздельно константы объекта A,B и регулятора K. Но для односвязного объекта n-го порядка матрица (A-B*K) содержат только n неизвестных констант. Поэтому для цели идентификации можно свернуть систему из n уравнений (5) в одно уравнение. Удобнее всего для этого умножить векторное уравнение (5) слева на вектор-строку Rt. С учетом (4) получим:

(6)…..Rt*X(t)=(Kopt-K)*X(t-1)+Rt*h(t).
Здесь учтено непосредственно проверяемое тождество Rt*B=1. Обозначим вектор-строку Kopt-K через ∆K. Эту вектор-строку коэффициентов можно найти идентификацией полученного уравнения (6). После этого оптимальную настройку регулятора Kopt можно найти по определению матрицы ∆K:

(7)…..Kopt=K+∆K.

Единственное, что здесь следовало догадаться – это установить в регуляторе некоторые начальные значения констант K и не изменять их до окончания идентификации.
Идентификацию уравнения (6) проще всего произвести по методу наименьших квадратов (МНК) [2] по формуле:

(8)…… ∆K=b*P-1,

где b=∑Rt*X(t)*X(t-1)t, P=∑X(t-1)*X(t-1)t — расчетные вектор-строка и матрица, вычисляемые суммированием по измеряемым координатам состояния за период идентификации от t=1 до t=T.

Итак, получен следующий алгоритм настройки регулятора. До настройки устанавливается начальное значение вектора констант регулятора K. Затем производится идентификация контура регулирования и по ее результатам (вектор ∆K) определяется и устанавливается окончательное значение Kopt, которое оказывается оптимальным по выбранному критерию качества регулирования. Заметим, что полученный алгоритм предназначен для стационарного объекта регулирования, когда достаточно однократной процедуры идентификации. Но в промышленной практике более жизненна ситуация с непредсказуемой нестационарностью объекта регулирования, например, изменение конструктивных характеристик промышленных объектов (старение, замена или ремонт), изменение вероятностных параметров возмущений, существенное изменение технологического регламента производственных процессов и другие. В этой ситуации целесообразна непрерывная настройка регулятора, т. е. адаптация контура регулирования. Такой алгоритм адаптации получается просто: идентификация контура регулирования по уравнению (6) производится регулярно и после каждого цикла идентификации производится корректировка констант регулятора по рекуррентной формуле, естественно получающейся из (7):

(9)…..Kq=Kq-1+∆Kq,

где K0 — начальная настройка регулятора при q=1, q — номер цикла идентификации.

При этом идентификацию контура регулирования целесообразно производить также рекуррентным способом [2]. Таким образом, структура адаптивной системы регулирования со стандартным регулятором включает в себя внешний контур обратной связи в виде последовательного соединения блока идентификации (8) и блока суммирования (дискретного интегрирования) (9).

По алгоритму адаптации можно сделать следующие замечания.

1. В алгоритме настройки математическая модель конкретного объекта не используется и знать ее нет необходимости. Единственная необходимая априорная информация – это знание типа стандартного регулятора, который подходит для данного объекта.

2. В условиях постоянства констант объекта (стационарное поведение объекта регулирования) идентифицируемый вектор констант ∆K→0. При этом может возникнуть риск неустойчивости контура регулирования, описываемого уравнением (5). Это объясняется тем, что в области ∆K≈0, за счет естественной ошибки идентификации могут получаться разные знаки компонент вектора ∆K и могут нарушаться алгебраические условия устойчивости. Для исключения такой опасности в предлагаемой адаптивной системе можно ввести ограничитель компонент вектора ∆K по критерию устойчивости Гурвица, введя этот ограничитель между идентификатором и сумматором.

3. На практике промышленные системы регулирования часто настраивают не по минимуму средней квадратичной ошибки, а по критерию запаса устойчивости или подобным критериям, так как в условиях существенной нестационарности устойчивость важнее точности. Обозначим вектор констант регулятора, оптимальный в смысле максимума запаса устойчивости, через Kstab. Как известно, эта величина выражается через параметры объекта (см., например, [3] ) и ее можно считать известной функцией Kopt, т. е. Kstab=f(Kopt). Отсюда следует, что для перехода к настройке по критерию максимума запаса устойчивости уравнение сумматора (9) можно переписать в терминах Kstab следующим образом: f-1(Kstabq)=f-1(Kstabq-1)+∆Kq, где f-1 — обратная функция. При этом уравнение сумматора относительно выходной переменной Kstab преобразуется к виду:

(10)….. Kstabq=f(f-1(Kstabq-1)+∆Kq).

Аналогично можно принять любой из критериев, употребляемых в практике настройки регуляторов, выбрав для этого соответствующий вид функции .

4. Из практики известно, что ПИ-регуляторы вручную настраиваются легче ПИД-регуляторов и поэтому они, зачастую, обеспечивают лучшее качество регулирования в среднем. Но это преимущество нивелируется в случае автоматической настройки регулятора. Поэтому представляется целесообразным в системе, оснащенной контуром адаптации, преимущественно применять стандартные ПИД-регуляторы.

3. Экспериментальная проверка процедуры настройки регулятора

Помимо логического обоснования предлагаемой процедуры настройки, были количественно смоделированы примеры настройки для объектов, регулируемых ПИД-регулятором и существенно отличающихся от идеала класса 3-го порядка. В частности, вводилось запаздывание в канале регулирующего воздействия. При этом, чтобы оставаться в рамках линейной модели в пространстве состояний, запаздывание моделировалось в виде цепочки из трех инерционных звеньев первого порядка с единичным коэффициентом передачи и варьируемой постоянной времени Tз. Кроме того, генерировалось автокоррелированное случайное возмущение, в формирующем фильтре которого варьировалась постоянная времени Tв в диапазоне характеристик от белого шума (Tв=0) до самого «тяжёлого» винеровского случайного процесса (Tв→∞). Тем самым проверялись периферийные экземпляры множества систем с ПИД-регуляторами. Оказалось, что при относительно малом коэффициенте передачи объекта (a2≤0.3) данный класс объектов (3-го порядка) простирается до Tв =100 и Tз=5. При большем коэффициенте передачи объекта a2 системы с таким запаздыванием и с ПИД-регулятором становятся структурно неустойчивыми и, значит, не относятся к данному классу объектов. Это подтверждает тезис о том, что большинство промышленных односвязных объектов, удовлетворительно регулируются ПИ и ПИД регуляторами, причём такие регуляторы успешно настраиваются предложенным способом.

Литература

1. Справочник по теории автоматического управления / Под ред. А. А. Красовского. – М.: Наука, 1987. – 712 с.
2.Перельман И. И. Оперативная идентификация объектов управления. — М.: Энергоиздат, 1982. – 272с.
3. Самодиагностирующиеся автоматически настраиваемые ПИ- и ПИД-системы управления. З. Г. Салихов, А. М. Шубладзе, С. В. Гуляев, Т. И. Черепова. //Цветные металлы. — 2001. — №12. – С. 114 – 117.

Реквизиты автора: Михаил Яковлевич Фитерман, канд. техн. наук, ст. научн. сотр. ОАО «РУСАЛ ВАМИ», раб. телефон (812) 449 -5199, доб. 6210 (в тоновом режиме), моб. телефон 8-921-796 7839, e-mail [email protected]

Обсудить эту статью в форуме http://d.17-71.com/forums/viewtopic.php?id=13

Эта запись была опубликована 05.07.2007в 8:16 дп. В рубриках: ПИД закон, АСУ, Рецензированные статьи, Моделирование, Все статьи. Вы можете следить за ответами к этой записи через RSS 2.0. Вы можете оставить свой отзыв или трекбек со своего сайта.

Отзывов (4)

  1. 12.07.2007 в 12:00 дп


    РЕЦЕНЗИЯ

    Статьи
    к.т.н., с.н.с. Фитермана М.Я.

    «АДАПТИВНАЯ
    НАСТРОЙКА РЕГУЛЯТОРОВ АСР»

    Тема статьи весьма актуальна, поскольку современные технологические процессы невозможны без автоматики, а квалифицированных специалистов по настройке регуляторов недостаточно.

    По содержанию статьи.

    Автор не отличается последовательностью: сначала он утверждает, что: «…для создания промышленных систем автоматического регулирования (АСУТП) не требуется и математическое описание, ни синтез оптимальных алгоритмов стабилизации …», затем: «…оптимальный закон регулирования по минимуму среднеквадратичной ошибки, т.е. по минимуму квадратичной формы X(t)t*Q*X(t)…», который используется для синтеза алгоритма настройки регулятора. Кроме того, АСУТП — не система автоматического регулирования, а Автоматизированная Система Управления Технологическим Процессом.

    Далее. Квадратичная форма X(t)t*Q*X(t) приводит не к виду {8.4.22 или 8.4.24 в справочнике [1])}, а к следующему виду:

    J = X(t)t*Q*X(t) = Xt(t)·Q·X(t) = [A*X(t-1)+B*U(t)+h(t)]t·Q·[A*X(t-1)+B*U(t)+h(t)].

    Для объекта X(t)=A*X(t-1)+B*U(t)+h(t) по принятому в статье критерию J

    формула (2) U(t)=-Rt*A*X(t-1)неверна!!!

    Дальнейшие рассуждения (про алгоритм настройки регулятора) могут быть не связаны с предыдущими рассуждениями.

    Разработанный алгоритм настройки требует большого объёма вычислений, что сложно осуществить в контроллере.

    Хотелось бы получить от автора более подробной информации об экспериментальной проверке разработанного алгоритма. Оценивать работу не представляется возможным в отсутствие опубликованных экспериментальных данных проверки.

    д.т.н., проф. МГСУ Завьялов В.А.

    Автор: Zavyalov
  2. 13.07.2007 в 4:48 пп


    Ответ рецензенту проф., д.т.н. В.А.Завьялову

    Фитерман Михаил Яковлевич, к.т.н., с.н.с.

    ОАО «РУСАЛ ВАМИ», г. Санкт-Петербург

    1. Замечание рецензента: «…для создания промышленных систем автоматического регулирования (АСУТП) не требуется и математическое
    описание, ни синтез оптимальных алгоритмов стабилизации …», затем: «…оптимальный закон регулирования по минимуму среднеквадратичной ошибки, т.е. по инимуму квадратичной формы X(t)t*Q*X(t)…», который используется для синтеза алгоритма настройки регулятора.

    Ответ. Имеется ввиду, что разработчику или проектировщику промышленных систем регулирования, как правило, нет необходимости прибегать к математическому синтезу оптимального закона управления а, следовательно, ему не требуется математическая модель объекта. Для промышленных (чаще всего односвязных) объектов стабилизации такие законы регулирования давно найдены и стандартизованы в виде П-, ПИ- или ПИД-законов. Упомянутый в статье синтез оптимального закона управления по минимуму квадратичной формы от вектора состояния объекта привлечен только для обоснования структуры и алгоритма предлагаемого метода настройки. Эти математические процедуры и результаты не используются (не являются исполняемыми процедурами) при реализации алгоритма настройки.

    2. Замечание рецензента: «формула (2) U(t)=-Rt*A*X(t-1)неверна!!!»

    Ответ. При синтезе физически реализуемого закона управления ищется минимум математического ожидания квадратичной формы J=M[A*X(t-1)+B*U(t)+h(t)]t·Q·[A*X(t-1)+B*U(t)+h(t)]|h(τ) для всех будущих моментов времени τ от t до ∞, т. е. U(t) определяется из уравнения
    ∂J/∂U(t)=0. Но, в силу суперпозиции операторов дифференцирования ∂(∙)/∂U(t) и усреднения M[∙], вектор U(t) определяется уравнением M[Bt*Q*(A*X(t-1)+Bt*U(t)+h(t))]|h(τ) =0. По свойству белого шума величины h(t) и h(τ) не коррелированны во времени и их
    средние равны 0. Кроме того, в силу уравнения объекта X(t)=A*X(t-1)+B*U(t)+h(t), вектор X(t-1) зависит от реализации h(τ) для τ≤t-1 и не зависит от реализации h(τ) для τ≥t. Поэтому M[h(t)]|h(τ) =0, M[X(t-1)]|h(τ) =X(t-1) и уравнение для U(t) преобразуется к виду Bt*Q*(A*X(t-1)+Bt*U(t))=0.
    Отсюда и получается приведенная формула с вектором R=Q*B*(Bt*B)-1.

    3. Объем вычислений по алгоритму настройки определяется рекуррентным вычислением вектора ∆K в течение q-го цикла идентификации и вычислением
    нового настроечного вектора Kq=Kq-1+∆Kq

    в конце этого цикла. Как известно, рекуррентное вычисление вектора коэффициентов по одному уравнению объекта (без обращения матрицы P в (8)) считается достаточно экономным по объему вычислений (см., например, [2]) и легко реализуется в программном обеспечении серийного контроллера. При желании я могу привести проектный документ «Задание на программное обеспечение….» для настройки регуляторов АСУТП строящегося Сосногорского глиноземного завода.

    4. Для экспериментальной проверки предлагаемого метода настройки был запрограммирован комплекс «объект + ПИД-регулятор + алгоритм настройки, (включающий блок идентификации + блок дискретного интегратора). Для простоты и наглядности результатов программа создана не языками реального времени (как обычно делается для приложений), а средствами Microsoft Excel. Данный файл «Настр АСР(ПИД, вектор).XLS» вместе с пояснениями могу отправить Вам по e-mail в виде приложения.

    Пояснения
    к файлу «Настр АСР(ПИД, вектор).XLS»

    В данном файле запрограммирована процедура настройки констант ПИД-регулятора. В качестве имитатора объекта применена модель линейного объекта 3 порядка с отклонением регулируемого параметра от от его задания – вторая компонента вектора состояния X2, интегральная составляющая этого отклонения- первая компонента X1 и дифференциальная составляющая – третья компонента X3. Входное возмущение программируется автокоррелированным
    случайным процессом, Кроме того, в модель включено звено переходного запаздывания между регулятором и объектом.

    Файл состоит из трех листов: «АСУ», «адап» и «случ». На листе «АСУ» размещены:

    • Алгоритм ПИД-регулятора – расчет управления U.
    • Модель объекта, включая расчет координат состояния X={X1, X2, X3} и двух звеньев запаздывания U-1 и U-2. Константы этой модели – вектор Ko={K1o, K2o, K3o} и вектор B={B1, B2, B3}. Эти константы поименованы и приведены на листе «адап» в зеленых ячейках.
    • Алгоритм рекуррентной идентификации – расчет обратной матрицы P (компоненты P11, P12, P13, P22, P23, P33) и идентифицируемого вектора
      ∆K={∆K1, ∆K2, ∆K3}.Эти величины находятся через промежуточные переменные: вектор g={g1, g2, g3} и скаляр d.
    • Алгоритм расчета констант регулятора – вектора K={K1, K2, K3} по уравнению сумматора (дискретного интегратора) производится в конце каждого цикла дентификации.

    Все расчеты на листе «АСУ» проводятся в дискретном времени с тактом опроса измерителей состояния объекта (каждая строка на листе). Один
    цикл идентификации и коррекции настроек регулятора занимает Ту периодов опроса (Ту строк на листе). Текущий номер цикла идентификации и относительное время в цикле считается в столбцах J, K.

    На листе «адап» производятся расчеты, производимые только в конце каждого цикла идентификации. Поэтому на этом листе в Ту раз меньше строк, чем на листе «АСУ». Все варьируемые величины поименованы на листе «адап» в ячейках зеленого цвета и могут произвольно изменяться. Эти величины следующие:

    — начальные значения констант регулятора (в начале настройки) K1, K2, K3;

    — константы объекта K1o, K2o, K3o и В1, В2, В3;

    — интенсивность исходного возмущения (дискретного белого шума) сигН;

    — период идентификации Ту;

    — время корреляции возмущения Тф и время запаздывания Тзап;

    — матрица 3х3- мерная матрица Q.

    На этом же листе рассчитывается постоянный вектор R (строка I23 – L23).

    На этом же листе выводятся константы регулятора на каждом цикле идентификации – столбцы D – F, а также среднеквадратичные ошибки координаты X2 (СКОХ2) и величины Rt*X (СКОRX) – столбцы B и C. На этом же листе приводятся графики изменения констант регулятора и объекта и график СКОRX по циклам идентификации.

    Для статистической достоверности результатов настройки выбран большой суммарный интервал времени – 3000 дискретных моментов времени (3000 строк на листе «АСУ»). Кроме того, для повышения статистической достоверности результатов входные возмущения автоматически обновляются для каждого варианта расчетов. Для этого на листе «случ» размещен генератор случайных величин, автоматически обновляющийся при каждом изменении любой поименованной величины или нажатии клавиши Delete на любой свободной ячейке любого листа.

    Автор: Fiterman
  3. 18.07.2007 в 2:00 дп


    Комментарий к Ответу с.н.с., к.т.н., М.Я. Фитермана

    д.т.н., проф. МГСУ Завьялов В.А.

    1. Замечание рецензента: «…для создания промышленных систем автоматического регулирования (АСУТП) не требуется и математическое описание, ни синтез оптимальных алгоритмов стабилизации …», затем: «…оптимальный закон регулирования по минимуму среднеквадратичной ошибки, т.е. по минимуму квадратичной формы X(t)t*Q*X(t)…», который используется для синтеза алгоритма настройки регулятора.

    Ответ. Имеется ввиду, что разработчику или проектировщику промышленных систем регулирования, как правило, нет необходимости прибегать к математическому синтезу оптимального закона управления а, следовательно, ему не требуется математическая модель объекта. Для промышленных (чаще всего односвязных) объектов стабилизации такие законы регулирования давно найдены и стандартизованы в виде П-, ПИ- или ПИД-законов. Упомянутый в статье синтез оптимального закона управления по минимуму квадратичной формы от вектора состояния объекта привлечен только для обоснования структуры и алгоритма предлагаемого метода настройки. Эти математические процедуры и результаты не используются (не являются исполняемыми процедурами) при реализации алгоритма настройки.

    Моё мнение.

    Если автор считает, что все законы управления исчерпываются П-, ПИ- или ПИД-законами, то научный поиск нужно прекратить, в том числе и научные поиски автора!!!

    Далее. Если автор привлекает критерий оптимальности, то этот критерий нужно использовать корректно, а не как угодно автору. Обще известно, что критерий оптимальности определяет свойства синтезируемой системы. Если Вы хотите создать систему по собственному усмотрению, то скажите в каком смысле она «самая хорошая».

    Если речь идет о переходном процессе, оптимальном по критерию

    J = M[A*X(t-1)+B*U(t)+h(t)]t•Q•[A*X(t-1)+B*U(t)+h(t)]|h(τ), то о виде управляющего закона можно справиться у Ф. Чаки Современная теория управления. — М.: Мир, 1975. С.183- 184.

    2. Замечание рецензента: «формула (2) U(t)=-Rt*A*X(t-1)неверна!!!»

    Ответ. При синтезе физически реализуемого закона управления ищется минимум математического ожидания квадратичной формы J=M[A*X(t-1)+B*U(t)+h(t)]t•Q•[A*X(t-1)+B*U(t)+h(t)]|h(τ) для всех будущих моментов времени τ от t до ∞, т. е. U(t) определяется из уравнения ∂J/∂U(t)=0. Но, в силу суперпозиции операторов дифференцирования ∂(∙)/∂U(t) и усреднения M[∙], вектор U(t) определяется уравнением M[Bt*Q*(A*X(t-1)+Bt*U(t)+h(t))]|h(τ) =0. По свойству белого шума величины h(t) и h(τ) не коррелированны во времени и их средние равны 0. Кроме того, в силу уравнения объекта X(t)=A*X(t-1)+B*U(t)+h(t), вектор X(t-1) зависит от реализации h(τ) для τ≤t-1 и не зависит от реализации h(τ) для τ≥t. Поэтому M[h(t)]|h(τ) =0, M[X(t-1)]|h(τ) =X(t-1) и уравнение для U(t) преобразуется к виду Bt*Q*(A*X(t-1)+Bt*U(t))=0. Отсюда и получается приведенная формула с вектором R=Q*B*(Bt*B)-1.

    Моё мнение.

    Если M[Bt*Q*(A*X(t-1)+Bt*U(t)+h(t))]|h(τ) =0, то имеется в виду установившийся или стационарный процесс. Следовательно, речь идет о статической оптимизации. В этом случае регулятор кроме устойчивости и точности ничего не обеспечивает. Тогда нет смысла говорить о законах управления, поскольку переходный процесс закончился !!!.

    3. Объем вычислений по алгоритму настройки определяется рекуррентным вычислением вектора ∆K в течение q-го цикла идентификации и вычислением нового настроечного вектора Kq=Kq-1+∆Kq в конце этого цикла. Как известно, рекуррентное вычисление вектора коэффициентов по одному уравнению объекта (без обращения матрицы P в (8)) считается достаточно экономным по объему вычислений (см., например, [2]) и легко реализуется в программном обеспечении серийного контроллера. При желании я могу привести проектный документ «Задание на программное обеспечение….» для настройки регуляторов АСУТП строящегося Сосногорского глиноземного завода.

    4. Для экспериментальной проверки предлагаемого метода настройки был запрограммирован комплекс «объект + ПИД-регулятор + алгоритм настройки, (включающий блок идентификации + блок дискретного интегратора). Для простоты и наглядности результатов программа создана не языками реального времени (как обычно делается для приложений), а средствами Microsoft Excel. Данный файл «Настр АСР(ПИД, вектор).XLS» вместе с пояснениями могу отправить Вам по e-mail в виде приложения.

    Моё мнение.

    По пунктам 3 и 4 хотелось бы видеть результаты (а не задание) исследования на реальном объекте управления.

    Автор: Zavyalov
  4. 02.08.2007 в 11:20 пп


      Комментарий на мнение рецензента д.т.н., проф. МГСУ Завьялова В.А.

    – раунд 2.

      М. Я. Фитерман, к.т.н., с.н.с. ОАО «РУСАЛ ВАМИ»

      Замечание рецензента №1. «…то научный поиск нужно прекратить, в том числе и научные поиски автора!!!».

      Ответ №1. Думается, что г-н профессор здесь явно погорячился и ответ не нужен.

      Замечание рецензента № 2. Если речь идет о переходном процессе, оптимальном по критерию

      J = M[A*X(t-1)+B*U(t)+h(t)]t•Q•[A*X(t-1)+B*U(t)+h(t)]|h(τ), то о виде управляющего закона можно справиться у Ф. Чаки Современная теория управления. — М.: Мир, 1975. С.183- 184.

      Ответ № 2. Ф. Чаки имел в виду совсем не то, что в моей статье. Дело в том, что у него буква M обозначает матрицу, а в моей статье M – это оператор математического ожидания. Это общепринятый способ обозначения в научной литературе по управлению. Таким образом, г-н профессор слегка напутал.

      Замечание рецензента № 3. Далее. Если автор привлекает критерий оптимальности, то этот критерий нужно использовать корректно, а не как угодно автору. Обще известно, что критерий оптимальности определяет свойства синтезируемой системы. Если Вы хотите создать систему по собственному усмотрению, то скажите в каком смысле она «самая хорошая».

      Замечание рецензента № 4. Если M[Bt*Q*(A*X(t-1)+Bt*U(t)+h(t))]|h(τ) =0, то имеется в виду установившийся или стационарный процесс. Следовательно, речь идет о статической оптимизации. В этом случае регулятор кроме устойчивости и точности ничего не обеспечивает. Тогда нет смысла говорить о законах управления, поскольку переходный процесс закончился!!!.

      Ответ № 3. Что касается выбранного критерия оптимальности, это не мое изобретение. Этим критерием пользовались сами творцы современной теории управления и фильтрации, начиная с Р. Калмана. До книги Ф. Чаки эта теория еще не была сформирована и в его монографию не могла войти. В более поздних учебниках и справочниках такой вид целевой функции для оптимизации управления был, по-моему, незаслуженно забыт. По крайней мере, он не упоминается в очень обстоятельной классификации целевых функций в книге «Справочник по теории автоматического управления / Под ред. А. А. Красовского. – М.: Наука/. Поэтому я хочу реабилитировать критерий оптимальности, примененный в моей работе. Для этого следующий материал я посвящаю возможным наблюдателям нашей дискуссии, дабы они так же могли судить об истинности или ложности моих положений.

      Ответ № 4. Реальные объекты управления всегда подвержены действию случайных возмущений. Не будь этого, в теории и практике управления была бы не нужна обратная связь, которая через регулятор как раз и парирует эти возмущения. Классическая ТАУ оперирует аппаратом передаточных функций, который игнорирует случайные возмущающие воздействия или, в лучшем случае, пытается их учесть не явно и на качественном уровне. Современная ТАУ владеет аппаратом описания динамических объектов и систем в векторном пространстве состояния и поэтому может максимально адекватно на сегодня проводить математический анализ и синтез таких систем. Но здесь есть некоторая логическая нестыковка. Оказывается, что результаты синтеза оптимального закона управления методами классической и современной ТАУ иногда различаются и даже существенно. Это порождает скепсис у ученых и специалистов к более новому аппарату синтеза систем методом пространства состояния. Глубинные причины такого расхождения теорий пока не выявлены. Так, профессор Ротач В. Я. в статье «Теория автоматического управления: соответствуют ли ее основные положения действительности? // Промышленные АСУ и контроллеры. 2007. №3, отвечает на этот вопрос отрицательно, а автор справочника Красовский А. А. по его словам, вообще, считает положение критическим. Мне кажется, что причина такой нестыковки заключается в различии применяемых систем координат состояния объекта в обоих теоретических аппаратах. Об этом хочу написать в своей следующей статье для «Сборника статей». Для стабилизирующих систем промышленных АСУТП в режиме нормального функционирования нет понятия переходный процесс. Переходный процесс, по определению, предполагает реакцию объекта на отдельное входное воздействие типа скачка, импульса и т. п., но не на постоянно действующее случайное возмущение. Поэтому обвинять меня, что «…переходный процесс закончился !!!. », по меньшей мере, не корректно. Далее, в такой ситуации постоянного функционирования системы критерий оптимальности не должен быть ни терминальным, ни даже интегральным. Для синтеза управления в дискретном времени достаточно оценивать качество управления только для каждого одного будущего шага управления. Это справедливо при условии отсутствия ограничений на управляющее воздействие. Действительно, если Вам удалось рассчитать и выдать такое управляющее воздействие, что в конце следующего такта управления ошибка окажется нулевой X(t+1)=0, то чего же еще желать. Здесь X(t+1) – ошибка, т.е. рассогласование на будущем (t+1)-м шаге управления. А если такой расчет и такая процедура управления повторяется на каждом шаге, то, очевидно, это и будет самая лучшая, оптимальная система управления. В случае, когда состояние объекта характеризуется не одной координатой состояния, а вектором состояния X(t+1) (объект выше первого порядка или многосвязная система), целевая функция представляется квадратичной формой X(t+1)t*QX(t+1). Здесь Q – матрица весовых коэффициентов, задающих степень учета координат состояния в квадратичной ошибке. (Например, для объекта 3-го порядка задаются 3 коэффициента: интегральной, пропорциональной и дифференциальной координат состояния.) Критерием оптимальности J является минимум этой квадратичной формы.

      Однако, при постоянно действующих возмущениях такой критерий не реалистичен. В этом случае критерием становится не квадратичная ошибка для следующего шага, а ее математическое ожидание J=M[X(t+1)t*QX(t+1)] по всем возможным возмущениям на этом шаге, т. е. среднеквадратичная ошибка. Именно такой критерий оптимальности является корректным не только в данной задаче с полной текущей информацией о состоянии объекта, но и для задачи с неполной (но достаточной) текущей информации. Такой подход к синтезу оптимального управления по среднеквадратичной ошибке, вычисляемой только для одного будущего шага управления, получил название принципа инвариантного управления (не помню, кто автор этого термина). Под инвариантностью здесь имеется в виду независимость ошибки на следующем шаге от ее величины на данном текущем шаге. Для получения явного вида целевой функции, как функции искомого управления U(t+1), вместо X(t+1) следует подставить уравнение объекта. Получается M[(A*X(t)+B*U(t+1))t*Q*(A*X(t)+B*U(t+1))]→min(U(t+1). Наконец, иногда требуется учесть в законе управления ограничения по мощности управляющих воздействий. Для этого в целевую функцию добавляют еще одну квадратичную форму для управления U(t+1). Такое усложнение запланировано в следующих работах автора.

      Замечание рецензента № 5. По пунктам 3 и 4 хотелось бы видеть результаты (а не задание) исследования на реальном объекте управления.

      Ответ №5. По-моему, проще всего поиграть с предлагаемым расчетным файлом с имитацией модели объекта 3-го порядка, усложненного автокоррелированным характером случайных возмущений и запаздыванием между регулятором и объектом. Данный файл Microsoft Excel приведен во вложении. К сожалению, у меня нет возможности проверки на реальном объекте, а не на имитаторе.

      Я призываю специалистов практиков, занятых обслуживанием и настройкой систем АСУТП, осуществить такую проверку. Необходимое программное обеспечение можно разместить либо на PC, включенном в заводскую сеть АСУТП, либо на переносном Notebook, либо в контроллере. Готов помочь любой консультацией, вплоть до алгоритма в виде задания на программирование. По результатам такой проверки метода настройки, в случае его жизнеспособности и конкурентоспособности, можно будет продвигать это дело в жизнь совместно.

    Автор: Fiterman

Оставьте свой отзыв

Примечание: Осуществляется проверка отзывов на соотвествие правилам, и это может задержать их публикацию. Отправлять отзыв повторно нет необходимости.