През последните десетилетия хората свикнаха да могат да получат всичко за минути, независимо дали говорим за храна, дрехи, наркотици. За да се осигури стабилността на качеството на стоките и капацитета им на пазара, е необходимо производствените съоръжения да се адаптират към тези условия. Една от възможностите е автоматизацията на индустрията. Въпреки това, за да се поддържа високото качество и безопасността на стоката, е необходимо да се създаде правилната система за контрол, която да отговаря на изискванията и по този начин е необходимо да се познава перфектно производствения процес. Тук сме изправени пред проблем. За да настроим правилните контроли, трябва да създадем правилния математически модел, който често може да бъде много сложен; с други думи, дизайнът му ще отнеме много време и следователно струва на компанията много пари.

създадем

За да избегнем тези проблеми, можем да използваме модели на бази данни вместо математически модели, които често са много по-прости и отнемат много време за създаване. Всичко, от което се нуждаем, за да проектираме модел на данните, са входните и изходните данни от процеса. Тук срещаме друг проблем. Данните от реалните процеси са до известна степен обременени с шум и поради това моделите, получени от тези данни, са юридически неточни. Поради тази причина първо трябва по някакъв начин да обработим сигнала.

Днес имаме редица методи, чрез които можем да обработим получения сигнал и един от тях е "гарантираната оценка на параметрите".
Следващият пример илюстрира как работи методът за гарантирана оценка на параметри (GPE). Нека си представим, че сме получили данни от процеса, който в този случай ще бъде функция с постоянни стойности. Знаем, че сензорът има определена грешка в измерването. Не знаем математическото предписание на процеса, от който сме получили данните и затова решаваме да ги апроксимираме с линейна функция и също така ще искаме получената линия да бъде в диапазона на грешката на измерването на сензора. Тъй като знаем входните и изходните данни, единствените неизвестни в уравнението са секцията и директивата. Нека изразим например директивата (P2) като функция на секцията (P1) и за всяка измерена информация изграждаме два реда, където екстремната стойност на грешката при измерване се взема предвид в изходните данни (зависима променлива ). Тези редове очертават областта на подходящи комбинации от параметри на модел, посока и разрез, с които можем да опишем данните и гарантираме, че правилното решение се намира някъде вътре в тази област.

Фиг. 1 - Гарантиран метод за оценка на параметрите - линейна регресия на измерените данни (идеализирани).

По този начин не само получихме информация за параметрите на модела, но и информация за сложността или. простота на модела. На фиг. 1 виждаме, че параметърът P2, т.е. посоката на линията, съдържа нула в своя интервал и по този начин за някои комбинации от параметри бихме получили нулева посока - нашето линейно описание е потенциално ненужно сложно и данните могат да бъдат добре описани от постоянна функция.

В предишния пример разгледахме измерените данни, които бяха идеализирани, т.е. сензорът измерва една и съща стойност във всяка точка, не се открива шум. Ако нашите измервания съдържаха шум и предположихме същата процедура като в предишния пример, резултатът ще бъде горе-долу същият, с разликата, че прогнозният интервал на стойностите на параметрите намалява.

Фиг.2 - Метод за оценка на гарантиран параметър - линейна регресия на измерените данни с шум.

По този начин имаме относително прост метод, чрез който можем да получим информация за параметрите и сложността на модела и да използваме тези свойства за идентифициране на модели на данни, особено при определяне на реда на модела, и този проблем е много по-сложен от проблема на определяне на параметрите на модела.

На фиг. 3 можем да видим формите на вълните на два различни модела, които са били обучени на различни данни. Фигурата вляво показва FIR модел, обучен на данни от преходна функция 1. от порядък с усилване Z = 8 и времева константа T = 2, която се възбужда от стъпкова промяна. Фигурата вдясно представлява подобен FIR модел с тази разлика, че данните, върху които е обучен моделът, идват от функция за преход на псевдослучайна двоична последователност (PRBS). Можем да заключим, че обученият в PRBS модел е значително по-добър по отношение на качеството. Освен че е по-близо до реалната стойност на самия процес, дисперсията на минималната и максималната реализация на изхода е много по-малка, така че имаме и по-малко ограничение на реалния ход на данните.

Друг показател, въз основа на който можем да оценим качеството на модела, е т.нар Парето отпред. Използвайки опашката на Парето, показахме предварителната подготовка на модела с неговата точност по отношение на реда на модела. Като част от семестриалния проект, ние също сравнихме резултатите от фронта на Парето и стандартните критерии. Има няколко от тези критерии - AIC (информационен критерий Akaike), BIC (критерий за информация на Байес) и AICc (AIC с корекция); и свържете точността на модела с неговия ред. За да сравним тези методи, трябваше да изградим поредица от тестове за два типа модели, където променихме величини като усилване на шума и разпределение на шума. Един от моделите апроксимира данните, получени от FIR модела, който се възбужда от псевдослучайна двоична последователност, а другият от моделите е обучен на данни от процеса, описан чрез предаване от първи ред със Z = 8 печалба и постоянна време T = 2 също се възбужда от PRBS.

Фиг. 4 - Сравнение на предната част на Парето (вляво) и стандартните критерии (вдясно) на модела, обучен по данни от FIR модел от 8-ми ред, построен с PRBS.

От резултатите установихме, че усилването на шума и неговото разпределение не оказват значително качествено въздействие върху отделните методи. Но както виждаме на ФИГ. 4, стандартните критерии не предлагат еднообразно решение за избор на реда на модела (най-добро = минимално на графиката). За разлика от него, фронтът на Парето показва, че ако искаме да подобрим малко точността на модела, ще получим модел с порядък по-голяма предварителна подготовка. Следователно моделът от 8-ми ред изглежда най-добрият вариант.

Фиг. 5 - Сравнение на опашката на Парето (вляво) и стандартните критерии (вдясно) на модел, обучен по данни от преходна функция от 1-ви ред с усилване Z = 8 и времева константа T = 2, възбудена с PRBS.

При изучаване на резултатите от модела, обучен на данните от предаването на процеса от 1-ви ред, може да се забележи следното. Както в първия случай, стандартните критерии дават неясни резултати и показват, че моделът от 7-ми до 12-ти ред може да бъде също толкова добър. От друга страна, фронтът на Парето показва, че ако постепенно увеличаваме реда на модела, т.е. точността на модела, предварителното определяне на модела няма да се увеличи, докато не попаднем на линеен проход (модел от 7-ми или 8-ми ред), където всяко подобрение в модела на точност вече би означавало голямо увеличение на предварителната подготовка.

Получаването на модел на данни, който би описал добре измерените данни, на пръв поглед не изглежда трудно, но както показахме, проблемът, свързан с него, е сравнително сложен. Обяснихме един прост метод за гарантирана оценка на параметрите, който не само ни предлага информация за параметрите на модела, но също така предоставя информация за сложността на модела. Проверката на коректността на модела обаче изглежда по-сложен въпрос, особено ако всеки метод предлага различен резултат, какъвто е случаят със стандартните критерии, докато методът с фронта на Парето дава ясни и последователни резултати.