Технология Тг1ддегБсап для эффективного обнаружения аномалий (эффективный поиск иголки в стоге сена)
Питер Дж. ПУПАЛАИКИС (Ре1ег J. РиРАЬАШв) Перевод: Алексей ПИВАК,
В статье рассмотрены методы по захвату аномалий, которые используются при отладке схем и поиске редких событий. Рассказано о новой технологии Тпддегвсап, которая впервые применена в осциллографах 1_еСгоу WavePro 7 21, и ее преимуществах перед традиционными методами поиска ошибок.
Введение
Отладка процессов — одна из важнейших задач разработчиков. Для ее решения используются цифровые осциллографы, которые должны отвечать ряду требований, одно из которых — иметь возможность быстрого поиска аномалий в сигнале.
При этом есть две важные задачи. Во-первых, корректно и полностью отобразить возможную проблему в исходном сигнале. Во-вторых, показать достаточно информации о проблеме, чтобы в дальнейшем настроить аппаратную схему запуска осциллографа и изолировать проблему. Выделение проблемы заканчивается, когда схема синхронизации осциллографа периодически срабатывает при появлении аномалии в сигнале и тестируются различные режимы работы отлаживаемого устройства для определения причинно-следственной связи возникновения ошибок.
Хороший способ для наглядного отображения проблемы — это синхронизация по фронту сигнала. Для цифровых запоминающих осциллографов в режиме включенного
«послесвечения» возможно отобразить наложение большого количества запусков развертки. При таком способе предположительно редкие события, встречающиеся в сигнале, будут захвачены.
Традиционный подход к обнаружению аномалий
Количественное определение пользы цифрового осциллографа при захвате редких событий — это среднее число аномалий в секунду, которое прибор может отобразить на экране. Также используется обратная величина — как среднее время, необходимое для детектирования одной аномалии.
Традиционный метод поиска аномалий заключается в переводе осциллографа в режим ждущего запуска по фронту сигнала и наблюдении разверток с «послесвечением» (как на аналоговом осциллографе), которые накладываются друг на друга при каждом запуске. После некоторого времени работы в таком режиме надо надеяться, что хотя бы одна из этих разверток отобразит аномалию. Когда используется данный метод, скорость захвата анома-
лий может быть рассчитана исходя из частоты исследуемого сигнала, скорости захвата осциллограмм и статистики частоты появления аномалий по следующей формуле:
АзахВат = тт(тахРэ*р, тахРсиг)х
Х(А/Рсиг), (1)
где АзахВат — количество захваченных аномалий в секунду; А — количество аномалий в секунду в сигнале; ¥сиг — частота сигнала; Ржр — частота обновления экрана осциллографа.
Отсюда следует, что если частота сигнала не превышает скорость захвата осциллограмм, то осциллограф будет захватывать каждый единичный фронт сигнала и, соответственно, каждую аномалию. Когда частота сигнала превышает частоту обновления экрана осциллографа, то осциллограф не сможет захватывать каждый фронт сигнала, и количество захватываемых прибором аномалий за секунду будет равняться частоте появления аномалий, деленной на частоту сигнала и частоту обновления экрана осциллографа (рис. 1).
При традиционном методе, когда частота сигнала ниже, чем частота обновления экрана, все работает отлично. Но при возрастании частоты сигнала достоверность метода будет ухудшаться. В настоящее время многие производители осциллографов предлагают режимы работы своих приборов с очень большой скоростью обновления экрана. Однако зачастую эти режимы имеют ограничения по возможностям, поэтому они полезны только для одной задачи — традиционного наблюдения наложенных друг на друга разверток, синхронизируемых по запуску по фронту сигнала. Другими словами, осциллографы в этом режиме предлагают пользователю только картинку сигнала и ничего больше.
Уравнение 1 — это зависимость между частотой появления аномалий во времени и частотой следования сигнала. Эта зависимость
интересна тем, что показывает, что аномалии, которые встречаются очень редко по отношению к количеству периодов сигнала, могут происходить очень часто во временной области. Рассмотрим случай, когда аномалии происходят 1 раз в 5 секунд в сигнале с частотой 200 МГц, например глитчи. Это значит, что количество аномалий за один период сигнала будет вычисляться так:
Афронт = А/^сиг, (2)
где Афронт — количество аномалий на 1 период сигнала.
В нашем примере с относительно часто встречающейся во времени аномалией — 1 раз в 5 секунд — количество периодов сигнала, за которое встречается одна аномалия, составляет 1 миллиард. Используя (1), среднее время, необходимое для обнаружения аномалий в такой ситуации на осциллографе со скоростью обновления экрана 100 000 осциллограмм в секунду, составит 2,8 часа! Повторим, это значит, что аномалия, случающаяся 1 раз в 5 секунд, будет захвачена осциллографом в среднем после 2,8 часов ожидания. Следовательно, существующие сейчас режимы быстрого обновления экрана на самом деле не являются настолько быстрыми — или точнее, они не являются достаточно быстрыми для решения реальных проблем. Поэтому при традиционном подходе к обнаружению аномалий необходима скорость обновления экрана намного выше, чем у существующих сегодня решений в осциллографии.
Система запуска
Проблемой при синхронизации по фронту для поиска аномалий является тот факт, что каждый раз, когда осциллограф проводит запуск по фронту и захватывает сигнал, какое-то время тратится на обработку, и осциллограф не воспринимает сигнал в этот период. Обычно его называют временем простоя. Многие пользователи осциллографов часто удивляются, как на самом деле велико время простоя по отношению к полезному времени работы. Возвращаясь к примеру, в котором осциллограф почти 3 часа ловит аномалию, происходящую 1 раз в 5 секунд, укажем на причину этого явления: прибор видит только 0,2% полного сигнала; он простаивает 99,8% времени, даже с режимом быстрого обновления экрана. Иначе говоря, осциллограф захватывает только каждый 500-й период входного сигнала.
Осциллографы с интеллектуальной системой синхронизации разработаны для улучшения такой ситуации. При использовании настроек синхронизации, предлагаемых интеллектуальными системами, прибор отслеживает каждый фронт сигнала до тех пор, пока не случится событие, удовлетворяющее условиям интеллектуального запуска. Время простоя начинает считаться, только когда
происходит событие, отвечающее условию по интеллектуальному запуску, и срабатывает схема сбора информации осциллографа. Такой подход идеален для поиска редких событий. Если интеллектуальная синхронизация настроена для поиска глитчей из предыдущего примера, то осциллограф будет синхронизироваться по каждому из них, не пропуская ни одного, и пользователь может наблюдать их на экране. При интеллектуальной синхронизации захват аномалий будет определяться следующим выражением:
АзахВат = min(Fэкр, А) (3)
где АзахВат — количество захваченных аномалий в секунду.
Таким образом, количество аномалий, захваченных за то же время, увеличивается при использовании интеллектуальной синхронизации по сравнению с запуском по фронту. Более того, как указывалось во введении, аномалии при этом изолируются. Другими словами, осциллограф будет захватывать только аномалии, при этом другие каналы прибора могут быть использованы для поиска причинно-следственной связи между аномалиями и режимами работы в контрольных точках настраиваемого устройства. Это все звучит просто, но на самом деле существует большая проблема в том, как правильно задать настройки интеллектуального запуска. Для этого пользователь осциллографа должен предварительно знать точную структуру аномалии. На практике такое не встречается.
Режим Тпддегвсап
К этому моменту мы определили два возможных пути по поиску редких событий. Недостаток традиционного метода в том, что, несмотря на использование режимов быстрого отображения, осциллограф может потратить часы на поиск относительно частых событий. Использование интеллектуальной синхронизации ограничено тем, что пользователь должен точно знать тип проблемы, которую он хочет увидеть.
Компания ЬеСгоу разработала новую систему для поиска редких событий, названную TriggerScan, которая снимает ограничения, возникающие при использовании интеллектуальной синхронизации (рис. 2).
Работа TriggerScan состоит из двух фаз. В первой фазе пользователь захватывает нормальный сигнал и таким образом «тренирует» систему. Во время тренировки осциллограф анализирует сигнал и определяет, каким должен быть нормальный сигнал без аномалий. Затем осциллограф производит настройку большого количества условий интеллектуальной синхронизации. Эти настройки разрабатываются для срабатывания синхронизации по аномальному сигналу. Например, если сигнал — это меандр сигнала тактовой частоты, и все его периоды имеют времена нарастания, длительности и амплитуды в рамках наблюдаемых статистических пределов, TriggerScan будет разрабатывать настройки интеллектуальной синхронизации по запуску на скорость нарастания, длительность или амплитуду импульсов, находящихся за пределами этих границ. После того как настройки интеллектуальной системы синхронизации определены, осциллограф переходит ко второй фазе работы путем последовательной загрузки настроек синхронизации, перевода осциллографа в ждущий режим по одной из них, ожидания при этой настройке в течение заданного времени, затем перехода к следующей настройке и т. д. Когда произойдет срабатывание при любой из настроек, захваченный сигнал будет выведен на экран в режиме «послесвечения». Если предположить, что конкретная аномалия детектируется как одна и только при одной настройке системы интеллектуальной синхронизации, то количество захватываемых за секунду аномалий будет определяться по уравнению:
АзахВат ~
(тт(РЭкр, А))/Ы, (4)
где АзахВат — количество захваченных аномалий в секунду; N — количество настроек системы запуска.
Обратим внимание на очень важный факт: эффективность TriggerScan не зависит от частоты входного сигнала, по сравнению с (3). «Расплачивается» за это режим TriggerScan по сравнению с режимом интеллектуальной синхронизации количеством используемых в работе настроек запуска. Если, например, работают 100 настроек, TriggerScan будет иметь 1% эффективности от использования только одной настройки интеллектуальной синхронизации. Это на первый взгляд выглядит
О Система ТпддегБсап.
10 МГц: кол-во настроек ТиддегБсап — 100, время для захвата — 100 с. 200 МГц: кол-во настроек ТпддегБсап — 100, время для захвата — 100 с. 500 МГц: кол-во настроек ТпддегБсап — 100, время для захвата — 100 с.
в Режим быстрого обновления экрана.
200 МГц: скорость обновления 100 000 осциллограмм в секунду, время для захвата 2000 с (в 20 раз дольше).
о Режим быстрого обновления экрана.
500 МГц: скорость обновления 100 000 осциллограмм в секунду, время для захвата 5000 с (в 50 раз дольше).
ЦЗО с режимом быстрого обновления экрана (при 10 МГц)
— ЦЗО с режимом быстрого обновления (при 200 МГц)
— ЦЗО с режимом быстрого обновления (при 500 МГц)
— ЦЗО 1_еСгоу с системой ТпддегБсап (при 10/200/500 МГц)
1х10~5
1x10
1х10“3 0,01 0,1
Период след. 1 аномалии
Рис. 3. Сравнение Тпддегвсап с режимом быстрого обновления экрана (необходимо захватить возникающую 1 раз в секунду аномалию в сигнале с частотой 10, 200 и 500 МГц)
большим ухудшением, но рассмотрим внимательнее полученный результат. TиggerScan уменьшает эффективность системы запуска, но зато автоматически настраивает параметры схемы запуска и полностью автоматизирует дальнейший процесс. В нашем примере традиционный метод с режимом быстрого обновления экрана до 100 000 раз в секунду в среднем будет отлавливать аномалию 1 раз за 2,8 часа. Применяя одну заведомо известную настройку интеллектуальной синхронизации, пользователь будет наблюдать каждую аномалию, которая случается 1 раз в 5 секунд. Используя TriggerScan со 100 настройками, пользователь будет обнаруживать аномалию в среднем 1 раз за каждые 500 секунд, или 8,3 минуты, то есть TriggerScan в 20 раз более эффективен, чем традиционный метод с быстрым обновлением экрана.
Графики, представленные на рис. 3, показывают сравнение TriggerScan с режимом быстрого обновления экрана. Графики даны для трех разных частот следования сигналов: 10 МГц (данная частота выбрана потому, что в этой точке эффективность режима TriggerScan и режима быстрого обновления экрана равна), 200 МГц (частота следования, характерная для большинства приложений) и 500 МГц. Последние два значения показывают, что эффективность TriggerScan увеличивается по сравнению с традиционным режимом при увеличении частоты.
Графики построены при следующих условиях:
• режим быстрого обновления экрана — 100 000 осциллограмм в секунду (некоторые осциллографы имеют скорость до 4 раз быстрее этого);
• 100 настроек запуска для TriggerScan (обычно используется меньше, но возможно использование и большего количества). Сравнение графиков показывает, что если
аномалии появляются все чаще, то режим TriggerScan достигает пика эффективности
при периоде следования аномалий 1 раз в 100 мс, а режим быстрого отображения продолжает улучшать показатели и при более частых аномалиях. Но более важно для реальной практики, что при увеличении частоты следования сигнала, преимущества TriggerScan также возрастают. Режим быстрого отображения экрана работает лучше при часто повторяющихся событиях на низких частотах следования сигналов, а TriggerScan — на редких событиях и на больших частотах.
Пользователь осциллографа должен сам решить, что ему важнее — редкие или частые события и на малых или больших частотах, и в соответствии с этим выбрать режим быстрого обновления или TriggerScan в качестве нужного инструмента для его приложений.
Другие соображения
TriggerScan выглядит жизненно необходимым инструментом для отладки процессов. Во многих случаях он превосходит режим быстрого обновления экрана по поиску редких событий. Также существуют и другие преимущества TriggerScan, которые должны быть отмечены. Они следствие того, что применяется система интеллектуального запуска и TriggerScan не является специальным режимом работы осциллографа, а только расширением и автоматизацией обычного режима работы прибора. Соответственно наибольшим преимуществом того, что TriggerScan — это не специальный режим, является то, что в остальном прибор работает как полнофункциональный осциллограф.
На рис. 4 приведено сравнение нормального режима и режима обновления данных. В нормальном режиме используется коррекция с помощью цифровой обработки сигнала, что увеличивает полосу пропускания прибора и программно стабилизирует точку за-
пуска. В режиме быстрого обновления цифровая обработка сигнала выключена.
То есть когда осциллограф работает в режиме TriggerScan, пользователь получает не только изображение ошибки, но и полную цифровую информацию о сигнале, которая может быть проанализирована с помощью математики или измерений. TriggerScan не сокращает возможности осциллографа по обработке и анализу сигнала.
Не только процесс полной оцифровки сигнала и передачи его для обработки в процессор ограничен или полностью исключен во многих исполнениях режима быстрого обновления, ограничиваются и другие процессы. Как пример можно привести различные калибровки и коррекции, прикладываемые к входному сигналу для компенсации аппаратных искажений осциллографа. Практически все современные высокочастотные
Рис. 4. Сравнение нормального (а) и режима быстрого обновления данных (б) экрана на конкурентном приборе
осциллографы используют в том или ином виде цифровую обработку сигналов для амплитудной и фазовой коррекции. В некоторых осциллографах эта цифровая коррекция выключается при работе режима быстрого обновления. Когда это происходит, пользователь может заметить, что сигнал в режиме быстрого обновления экрана выглядит другим по сравнению с нормальным режимом работы прибора. Режим быстрого сбора данных не всегда показывает правильную форму сигнала, поскольку программные коррекции работают не полностью. Зато TиggerScan, поскольку он всегда работает в нормальном режиме работы прибора, не создает таких проблем.
Подводя итог: TriggerScan использует интеллектуальную синхронизацию и позволяет локализовать аномалии. TriggerScan автоматически переводит осциллограф в режим работы, когда интеллектуальная система запуска срабатывает на аномалию. При режиме быстрого обновления пользователь имеет только графическую картинку и должен сам попытаться перенести параметры увиденной аномалии в настройки системы интеллектуальной синхронизации.
TriggerScan работает так, что во время сканирования он берет на себя управление прибором и автоматически загружает различные настройки системы синхронизации. Поскольку этот режим является простой машиной состояний, которая управляет прибором подобно роботизированному пользователю, он может быть легко использован для повторения тестов с известными настройками синхронизации. Настройки системы синхронизации даже могут быть вручную отредактированы и сохранены. Список настроек синхронизации может быть создан в качестве набора для проведения автоматических тестов на соответствие.
Заключение
Режим быстрого обновления полезен для использования при традиционных отладках, когда аномалии не слишком редкие и частота сигналов относительно низкая. Этот режим будет вызывать проблемы при анализе очень редких аномалий и при высокой частоте сигналов относительно скорости обновления экрана самого осциллографа.
TriggerScan — это способ улучшить ситуацию при отладке. Его эффективность по выводу аномалий на экран растет при увеличении частоты сигнала и улучшается для редких событий относительно режима быстрого обновления. Для частоты сигналов, превосходящей десятки мегагерц, он будет всегда работать адекватно поставленным задачам, а его характеристики будут значительно превосходить характеристики режима быстрого обновления при поиске редких событий.
Развертки, захваченные в режиме TriggerScan, обрабатываются при максимальной частоте дискретизации, полностью достоверные, они могут занимать большой объем памяти и в дальнейшем использоваться для сложной пост-обработки.
TriggerScan может быть использован для работы в других контрольных точках настраиваемой схемы в процессе сканирования аномалий, и настройки синхронизации, необходимые для захвата аномалий, могут быть сохранены для дальнейшего использования при отладке процессов.
TriggerScan — это полезное добавление в арсенал инструментов для отладки, доступный пользователям осциллографов LeCroy. ■