Подходы при создании математического обеспечения в таксономических исследованиях микроорганизмов

Некогда читать? Сохрани:

Несмотря на существующее многообразие алгоритмов и соответствующих им прикладных пакетов программ для обработки экспериментальных данных, носящих характер многоэкстремальных кривых, в настоящее время можно выделить два основных подхода, которые используют разработчики при создании математического обеспечения: 1) эвристический (или логический), который моделирует логику исследователя при анализе экспериментальных данных; 2) статистический, который позволяет выделить из экспериментальных данных информацию, не заметную для исследователя.

Эвристический подход в значительной мере зависит от накопленного исследователем опыта при оценке экспериментальной информации. К сожалению, правильная интерпретация многоэкстремальных кривых — это большое искусство и не подчиняется каким-либо общим правилам, что создает определенные трудности алгоритмизации процесса обработки. Поэтому задача моделирования на ЭВМ при обработке многоэкстремальных кривых с учетом трудностей, с которыми исследователю приходится встречаться в процессе анализа, с одной стороны, дает широкие возможности разработки для различных вариантов алгоритмов, а с другой — не позволяет создать универсальный алгоритм.

Основной проблемой постулирования этих алгоритмов является адекватное выделение границ пиков в случае их наложения и присутствия «плечей». Существенна также задача отсева «ложных» пиков при малых уровнях сигналов и наличии широко полосного шума. Наибольшие успехи в создании алгоритмов и программ математического обеспечения для обработки многоэкстремальных кривых достигнуты в области физического (ЯМР-и ЭПР-спектрограмм) и химического (хроматограмм) экспериментов. Они могут быть реализованы на ЭВМ различных серий и поколений «Электроника—100», СМ—1 и СМ—2, СМ—3 и СМ—4, ЕС—1010 и ЕС—1033 и др. Как правило, подобное программное обеспечение ориентировано на решение узкого класса задач, что существенно ограничивает область применения разработанных пакетов программ.

В настоящее время намечается тенденция к разработке алгоритмов, базирующихся на интерактивном режиме анализа кривых с использованием эксперименхатором «интеллектуальных» терминалов (например, графических дисплеев со световым пером или яркостной меткой). Такой подход позволяет создать более надежные алгоритмы выделения информативных параметров на фоне различного рода помех. На основе этого подхода возможно разработать алгоритм анализа, с помощью которого осуществляется скользящий машинный поиск всех экстремумов на кривой без вмешательства человека, а затем на основе интерактивного режима исследователь корректирует найденные координаты границ пиков, производит отсев артефактов.

Скользящий машинный поиск экстремумов обычно обеспечивается с помощью алгоритмов, основанных на детерминированных методах, в которых для определения характерных точек пика используются одна или две текущие ординаты сигнала. Обнаружение пика производится по значениям отклонения или производной. Алгоритм критичен к шумам в сигнале и требует обязательной фильтрации высокочастотных составляющих. Фильтрация шумов обычно выполняется с помощью линейных фильтров, размер окон которых является функцией времени. Для разделения перекрывающихся пиков некоторыми разработчиками применяется метод наименьших квадратов.

Рассмотренные алгоритмы относятся к разряду так называемых «жестких» алгоритмов, в режиме работы которых не предусматривается вмешательство человека в процесс машинного счета. Однако появление особых ограничений в алгоритмах для разделения перекрывающихся пиков показывает необходимость привлечения исследователя для оценки ситуации, складывающейся в процессе машинного анализа. При этом создаются предпосылки для развития и создания более «гибких» алгоритмов анализа кривых, которые, базируясь на эвристическом подходе, сочетают вычислительные возможности ЭВМ с опытом исследователя при оценке различного рода артефактных ситуаций. Это становится возможным лишь в том случае, когда в вычислительной системе имеются терминальные средства, обеспечивающие интерактивный режим работы «человек—ЭВМ».

В последнее время намечается тенденция к совмещению статистических и эвристических алгоритмов для анализа многоэкстремальных кривых. На основе этого подхода было создано математическое обеспечение автоматического анализа денситограмм. Если число пиков невелико (N~7), используется математическое обеспечение, реализующее эвристический подход на базе интерактивного режима обработки. Для денситограмм с большим числом пиков (N~25) применяется статистический подход.

На рис. 24 приведена структурная схема математического обеспечения и показана связь между его программными модулями, осуществляющими реализацию эвристического и статистического подходов автоматического анализа денситограмм.

Структурная схема математического обеспечения автоматического анализа денситограмм

Рис. 24. Структурная схема математического обеспечения автоматического анализа денситограмм

Совокупность программных модулей (блоки 1, 2, 3) составляет ядро системного программного обеспечения АРМа и позволяет решить следующие задачи:

  1. ввод с АЦП цифровых значений денситограмм;
  2. организацию массивов цифровых значении оптической плотности в ОЗУ микропроцессорного устройства;
  3. вывод через ЦАП на экран электронно-лучевой трубки изображения многоэкстремальной кривой;
  4. регенерацию изображения на экране ЭЛТ денситометрической реализации и базисной линии;
  5. ввод координаты яркостной метки в ОЗУ ЭВМ в режиме прерывания;
  6. вывод через ЦАП на планшетный самописец графиков в масштабе, задаваемом оператором.

В состав проблемно-ориентированного обеспечения АРМа были включены рабочие программы для решения следующих задач:

  1. определение координат границ пиков на денситограмме с помощью «жесткого» и интерактивного режима (блоки 5, 3);
  2. вычисление содержания вещества (в процентах) во фракциях (блок 6);
  3. вычисление Rj-параметра (относительная электрофоретическая подвижность фракций) (блок 7);
  4. сравнительный анализ денситограмм по параметру Rj и вычисление коэффициентов подобия (блок 7 и 8.3);
  5. вычисление авто- и взаимной функции корреляции денситограмм (блоки 4 и 8.1).

Такая организация структуры технического и математического обеспечения АРМа «Электрофорез» позволяет наиболее полно удовлетворить потребности исследователей-микробиологов при проведении количественных сопоставлений белковых спектров.

Читать далее по теме: