Научная статья на тему 'Разработка методов и алгоритмов классификации опасностей химической продукции в условиях неопределенности'

Разработка методов и алгоритмов классификации опасностей химической продукции в условиях неопределенности Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
133
45
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Карибова Ю. А., Савицкая Т. В.

В данной работе рассмотрен процесс разработки формализованных методов и алгоритмов классификации опасностей химической продукции в условиях неопределенности, то есть при недостатке или противоречивости исходных данных, необходимых для классификации.I

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Карибова Ю. А., Савицкая Т. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

n this work the process of development of formalized methods and algorithms of classification of hazardsof chemical products is considered, i.e. when the initial data for classification are insufficient or contradictory.

Текст научной работы на тему «Разработка методов и алгоритмов классификации опасностей химической продукции в условиях неопределенности»

просов. Результаты классификации используются при создании документов, информирующих об опасных свойствах продукции - ПБ и ПМ, для формирования которых также используются программные модули и базы данных. В качестве примера рассмотрим разработку структуры БД по паспортам безопасности химической продукции, как одну из основных составляющих процесса информирования. Исходя из структуры ПБ химической продукции, установленной ГОСТ 30333-2007, разработаны логическая модель базы данных, состоящая из 11 таблиц и выполненная в виде ER-диаграммы (диаграммы "сущность-связь").БД включает информацию по показателям опасности, обусловленной физико-химическими свойствами, по показателям острой/хронической токсичности для здоровья человека, по показателям экотоксичности для информирования об опасностях воздействия на окружающую среду. Для представления текстовой информации паспорта безопасности (например, по мерам предосторожности) в структуре БД предусмотрена таблица для хранения текстовых разделов/подразделов Паспорта. В соответствии с логической моделью разработана физическая модель БД, реализованная в системе управления базами данных Oracle eXpress Edition (ХЕ). Предусмотрен поиск информации в базе данных по номерам CAS (Chemical Abstracts Service) - номер вещества в реестре Химической Реферативной Службы, EC - номер, присваиваемый Европейской Комиссией, веществам находящимся в обращении на территории ЕС, классу опасности.

Таким образом, в ходе работы созданы программно-алгоритмические средства для информационной поддержки процессов безопасного обращения химической продукции.

УДК: 658 + 504:378

Ю.А. Карибова, Т.В. Савицкая

Российский химико-технологический университет им. Д. И. Менделеева, Москва, Россия

РАЗРАБОТКА МЕТОДОВ И АЛГОРИТМОВ КЛАССИФИКАЦИИ ОПАСНОСТЕЙ ХИМИЧЕСКОЙ ПРОДУКЦИИ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

В данной работе рассмотрен процесс разработки формализованных методов и алгоритмов классификации опасностей химической продукции в условиях неопределенности, то есть при недостатке или противоречивости исходных данных, необходимых для классификации.

In this work the process of development of formalized methods and algorithms of classification of hazardsof chemical products is considered, i.e. when the initial data for classification are insufficient or contradictory.

Химическая продукция имеет огромное значение для человека. Однако ее производство, использование, хранение и утилизация сопряжены с рядом опасностей для здоровья и жизни людей, окружающей среды. Для то-

го чтобы избежать возможных тяжелых последствий при неправильном обращении с химической продукцией, проводится ее классификация по видам опасностей, в соответствии с которой на упаковку химической продукции наносится предупредительная маркировка. Для идентификации, классификации, маркировки и упаковки веществ в РФ и странах Европейского Союза (ЕС) разработан ряд нормативных документов. В соответствии с этими документами составляются паспорта безопасности химической продукции.

Большую сложность представляет собой именно классификация химической продукции по целому ряду видов опасности. Классификация осуществляется на основании данных о физико-химических свойствах химической продукции, данных по ее токсичности и экотоксичности. Эти данные не всегда имеются в наличии, а проведение экспериментальных исследований является дорогостоящей процедурой. Существует огромное количество баз данных, содержащих результаты лабораторных исследований для различной химической продукции. Однако эта информация зачастую является неполной или противоречивой. Поэтому актуальна разработка методов, позволяющих прогнозировать неизвестные свойства химических веществ по имеющимся результатам экспериментов, и на основе полученных прогнозов классифицировать химическую продукцию.

В случае отсутствия опытных данных для нахождения оценочных значений возможно использование расчетных методик. Причем для органических веществ, свойства которых во многом определяются их структурной формулой, широко используется методология QSAR - Quantitative Structure-Activity Relationship, которая основана на предположении о существовании связи между активностью и структурой вещества [1]. В рамках QSAR осуществляется построение моделей, позволяющих по описанию структур химических соединений предсказывать их свойства (физические, химические, биологическую активность). С помощью данной методологии возможно определение многих физических свойств веществ, например, температуры кипения, вязкости, давления насыщенных паров и др.

Если рассматривать химическую продукцию как объект классификации, а ее свойства - как признаки, по которым осуществляется классификация, то нужно отметить, что имеющиеся данные чаще всего являются комбинированными, т.е. включают признаки разных типов (вероятностные, логические и проч.). Например, большая часть физико-химических свойств являются вероятностными признаками. В большинстве случаев для конкретного вещества эти данные согласуются между собой в различных источниках. Но бывает, что они друг другу противоречат, тогда появляется неопределенность. Еще сложнее ситуация с экспериментальными данными по токсичности и экотоксичности, которые получают в опытах над животными. Так как проводить эксперимент в абсолютно одинаковых условиях невозможно, в современных источниках информации представлено множество данных по этим экспериментам, которые зачастую сильно различаются. Это также вносит неопределенность в процесс классификации опасности химической продукции. Данные, например, по канцерогенности, мутагенности являются скорее качественными, нежели количественными. Таким образом,

необходима разработка некоторого формализованного алгоритма, в котором учитывались бы различные типы классификационных признаков и различное количество классов для разных видов опасности.

Необходимо также учитывать, что при классификации, например, по острой токсичности при внутрижелудочном введении рассматривается 5 классов опасности, в то время как при классификации по канцерогенности -только два класса. Поэтому для разных видов опасности должны применяться различные методы классификации, учитывающие специфику именно рассматриваемого вида. Для видов опасности, включающих большое количество классов (больше 2) предлагается использовать нейронные сети или же различные пространственные метрики (евклидово расстояние, расстояние Пирсона). Нейронные сети предлагается обучать на основе выборки из веществ, проклассифицированных согласно с рекомендациями СГС (Согласованная на глобальном уровне система классификации опасности и маркировки химической продукции) [2] с использованием программно-информационного ресурса, размещенного на сайте

ChemicalManagementField [3]. Для видов опасности, включающих только 2 класса, такие сложные методы классификации, требующие большого количества обучающих примеров, использовать нерационально. Для них предлагается использовать простые классификаторы, например, классификатор на основе критерия Байеса. Необходимые для этого метода априорные вероятности отнесения химической продукции к тому или иному классу опасности предлагается определить исходя из имеющейся выборки по химическим веществам, для которых известны классы опасности по рассматриваемым видам опасности.

Для классификации опасностей химической продукции в условиях неопределенности разработаны следующие рекомендации: при отсутствии данных по острой токсичности можно воспользоваться нейронными сетями, обученными на выборке известных веществ, причем для каждого вида острой токсичности (при введении в желудок, при накожном нанесении, при ингаляционном воздействии) должна обучаться отдельная нейронная сеть. Также можно использовать прогноз класса опасности по острой токсичности с помощью евклидова расстояния и по методологии РБАЯ с использование программы рБАЯТооШох. На основе полученных данных сделать вывод о предварительной классификации химической продукции по острой токсичности. При классификации по респираторной и кожной сенсибилизации используются только 2 класса, поэтому для этих видов опасности целесообразно применять критерий Байеса. Для оценки мутагенности, канцерогенности, репродуктивной токсичности, избирательной токсичности при однократном и многократном воздействии рекомендуется пользоваться продукционными правилами, разработанными на основе анализа данных для 53 жидкостей. Например, если данных о мутагенности рассматриваемой жидкости нет, то она может относиться к 1 классу опасности по мутагенности с вероятностью 7%, ко 2 классу - с вероятностью 30%, и с вероятностью 64% не будет относиться к мутагенам.

Библиографические ссылки

1. Википедия. Поиск количественных соотношений структура-свойство [Электронный ресурс]. - Режим доступа: http://ru.wikipedia.org/wiki/ (дата обращения: 18.04.2012).

2. Согласованная на глобальном уровне система классификации опасности и маркировки химической продукции (СГС). - ЗТ/ЗО/АСЛО/ЗО/ЯеуА -Издание 4-е, пересмотренное [Электронный ресурс]. - Режим доступа: http://www.unece.org/ru/trans/danger/publi/ghs/ghs_rev04/04files_r.html (дата обращения: 03.05.2012).

3. СМБ: ChemicalManagementField (Регулирование химических веществ) [Электронный ресурс]. - Режим доступа: http://www.safe.nite.go.Jp/english/ghs_index.html#results (дата обращения: 18.О4.2О12).

УДК 004.891: 661.11

Т.И. Степанова, В.Е. Трохин, А.Л. Кочетыгов, М.Ю. Гафитулин, A.M. Бессарабов

Научный центр «Малотоннажная химия», Москва, Россия

ЭКСПЕРТНАЯ СИСТЕМА ПО ВЫБОРУ КОНСТРУКЦИОННЫХ МАТЕРИАЛОВ В ТЕХНОЛОГИИ ХИМИЧЕСКИХ РЕАКТИВОВ И ОСОБО ЧИСТЫХ ХИМИЧЕСКИХ ВЕЩЕСТВ

На основании базы данных «Конструкционные материалы» разработана экспертная система по выбору конструкционных материалов для химических реактивов и особо чистых химических веществ. Алгоритм работы экспертной системы рассмотрен на примере выбора материала для химического реактора, имеющего контакт с фтористоводородной кислотой.

The expert system for selection of constructional materials for chemical reagents and high purity chemical substances was developed based on the database "Constructional materials". The algorithm of the expert system's functioning considered on the example of the material selection for chemical reactor that has contact with hydrofluoric acid.

Вопросы технологии особо чистых веществ очень сложны, и только учет всех факторов обеспечивает успех решаемых проблем. Одним из важнейших факторов является проблема выбора перспективных конструкционных материалов для создания аппаратуры и тары, а также разработка методов их подготовки и нахождения оптимальных параметров их использования. Решение данной задачи возможно только на основе современных систем информационного обеспечения.

Нами была разработана база данных (БД) "Конструкционные материалы" [1] предназначенная для помощи инженерам-технологам при выборе конструкционных материалов для создания оборудования и тары для особо чистых веществ, реакторов химических установок, для разработки изделий микроэлектроники, медицинской техники. Но для проведения поиска материалов в такой БД (а соответственно и изделий из них) для конкретного

i Надоели баннеры? Вы всегда можете отключить рекламу.