Експертні системи у медицині
Зіставляючи (1.1) і (1.2), приходимо до висновку, що формула Байєса дозволяє практично за однією і тією ж схемою обчислень здійснювати висновки як у прямому («ознаку захворювання»), так і в зворотному («захворювання ознака») напрямках. Причиною тому — принципова особливість формули Байєса, яка встановлює зв’язок не між «причиною» і «слідством», а між двома довільними подіями. Співвідношення (1.2… Читати ще >
Експертні системи у медицині (реферат, курсова, диплом, контрольна)
ВСТУП Експертна система — це набір програм, що виконує функції експерта при вирішенні завдань з певної предметної області. Експертні системи видають поради, проводять аналіз, дають консультації. Практичне застосування експертних систем на підприємствах сприяє ефективності роботи та підвищенню кваліфікації фахівців.
За допомогою експертних систем можна швидко та якісно отримати пояснення на яке-небудь запитання, без дії впливу людського фактору. Так як важко зробити іноді висновок та прийти до вірного рішення одній, іноді некомпетентній, людині. Для цього існують спеціально розроблені програми, які будуються не однією особою, а великою кількістю експертів, кожен з яких вносить великий вклад в розвиток експертної системи. Та щоб система вміщала в себе широкий спектр рішень та пропозицій до неї вводять різноманітні вірогідності, які вказують на мінливість отриманого результату.
Експертні системи, що використовують теорію суб'єктивних ймовірностей, ґрунтуються на Байєсовському методі, методі Вальда, чи як ще його називають — метод послідовного статистичного аналізу, діагностичних таблицях Сано, методі лінійних дискримінативних функціях, та ін.
Використання суб'єктивних очікувань у байесових мережах є єдиною альтернативою на практиці, якщо необхідний облік думки експертів (наприклад, лікарів) про можливість настання події, до якого застосовується поняття повторюваності, а також неможливо його опис в термінах сукупності елементарних подій.
За допомогою цих методів можна розрахувати поширення ймовірності в експертних системах, що є більш зручним методом для розрахунку, аніж припустимо за допомогою статистичних функцій. За допомогою байесовської теорії можна розрахувати вірогідність того чи іншого судження, в якому не впевнені. Тобто, вірогідність визначається як ступінь впевненості в істинності судження. Але яким би не здавався цей метод хорошим існують деякі негативні аспекти у використанні цієї теорії. Так наприклад психологічно експерту в багатьох випадках важко залишатись в рамках строгого математичного апарату теорії ймовірностей, яка по своїй природі носить об'єктивний характер. Необхідно порушувати жорстокі умови рівності одиниці сум вірогідностей всіх можливих станів, особливо при їх великій кількості. В багатьох випадках реально спостерігаючі свідоцтва підтверджують не який-небудь певний результат (чи гіпотезу), а відразу ж деяку множину, що не дозволяє визначити вірогідність кожного з них. Якщо експерт оцінює величини, мають вельми неясний сенс, властивості яких у багатьох випадках не збігаються зі звичними уявленнями, можна зіткнутися з тим, що її відповіді не будуть нести корисної інформації про оцінювані величини.
Експертні системи, що використовують теорію суб'єктивних ймовірностей, користуються великим попитом серед експертних систем для пошуку рішень. Ці експертні системи дозволяють швидко та правдиво давати вірну відповідь на різноманітні питання у вузькій предметній області.
1. АНАЛІЗ ТЕОРІЇ СУБ'ЄКТИВНИХ ЙМОВІРНОСТЕЙ
1.1 Теорія суб'єктивних ймовірностей Основне поняття ймовірності настільки природно, що воно відіграє значну роль у повсякденному житті. Розмови, що стосуються ймовірності дощу або гарного врожаю на городі часто зустрічаються в нашому житті. Поняття ймовірності було розроблено кілька сторіч назад. Але вже тисячі років людина використовує такі слова, як «може бути», «шанс», «удача» або інші їх еквіваленти в розмовній мові.
Однак математична теорія ймовірностей була сформульована відносно недавно (близько 1660 року). Імовірність події класично визначається як відношення випадків у які дана подія відбувається до загального числа спостережень.
Однак можливі й інші визначення. У цей час існує кілька інтерпретацій теорії ймовірностей. Розглянемо три найбільш домінуючих погляди.
Об'єктивістський погляд. Полягає в тому, що розглядає ймовірність відношення наслідків до всіх спостережень в ході тривалого часу. Іншими словами цей підхід заснований на законі великих чисел, що гарантують те, що при наявності досить великої кількості спостережень частота наслідків події, що цікавить, буде прагнути до об'єктивної ймовірності.
Персоніфікований, суб'єктивістський або заснований на судженнях погляд. Полягає в тому, що імовірнісна міра розглядається як ступінь довіри того, як окрема особистість судить про істинність деякого висловлення. Цей погляд постулує, що дана особистість має в деякому смислі відношення до цієї події. Але це не заперечує можливості того, що дві прийнятні особистості можуть мати різні ступені довіри для того самого судження. Термін «байєсовський» часто використовується як синонім суб'єктивної ймовірності.
Необхідний або логічний. Характеризується тим, що імовірнісна міра розширюється на множину тверджень, що мають логічний зв’язок такий, що істинність одного з них може виводитися з іншого. Іншими словами ймовірність вимірює ступень доведеності логічно вивіреного висновку. Такий погляд можна розглядати як розширення звичайної логіки.
Ці імовірнісні інтерпретації використовують і різні схеми висновку. Однак існує всього дві школи імовірнісних розрахунків: школа Паскаля (або загальноприйнята), школа Бекона (або індуктивна). Розрахунки за Паскалем використовують байєсовскі правила для перевірки й обробки мір довіри. Обчислення за Беконом використовують правила логіки для доказу або спростування гіпотез. Таким чином, загальноприйняті ймовірності (за Паскалем) не можуть бути отримані з індуктивних ймовірностей (за Беконом) і, навпаки. Об'єктивістський і суб'єктивний погляди використовують розрахунки за Паскалем. Ті, хто підтримують логічні висновки використовують розрахунки за Беконом.
Існують експертні системи, побудовані на обох з цих напрямків. Однак в експертних системах бази знань накопичують людські знання, тому для подання знань експертів з урахуванням ймовірностей найбільш підходящою є інтерпретація на основі суб'єктивних довір. У результаті чого й більшість сучасних експертних систем, що використовують теорію ймовірностей, є «байєсовськими» [1].
1.2 Байєсівська стратегія як форма реалізації правил продукції
Введене в рамках медичної кібернетики поняття «медицинської пам’яті» та поширені в медичній практиці діагностичні таблиці, можна трактувати як бази фактів, які встановлюють залежність між симптомами (ознаками) і захворюваннями.
Структура таблиць зручна для реалізації загальної та диферен-ференціальной діагностики, яким властиві міркування виду «ознака захворювання», що реалізують «прямий» напрям логічних міркувань. При приватній діагностиці, коли потрібно перевірити наявність передбачуваного захворювання, реалізується «обернений» напрям міркувань «захворювання ознака» для перевірки наявності ознак, що підтверджують гіпотезу про наявність захворювання. Для цієї мети також можна використовувати таблиці вищенаведених типів, хоча, для скорочення часу пошуку інформації, їх можна трансформувати.
Разом з тим, таблиці «незручні» для ЕОМ, що оперують з числами. Вони незручні і для самих лікарів. Найбільш природним виходом з цієї ситуації представляється використання імовірнісної форми правила продукції. Тим більше, що при розробці алгоритмів медичної діагностики знайшли достатньо широке застосування:
* імовірнісний метод, що складається в обчисленні ймовірностей захворювань за формулою Байєса;
* метод послідовного статистичного аналізу Вальда;
* метод пошуку клінічного прецеденту.
З точки зору форми представлення кінцевого результату, принципової різниці між перерахованими методами немає - при практичній реалізації всі вони зводяться до оцінювання умовної ймовірності P (Yj / Xi), де Yj — найменування j-того захворювання, Xi — i-та ознака.
Витоки такого підходу можна угледіти, по-перше, в типах використовуваних в медицині, психіатрії та психології шкал ознак і нозологічних форм — це шкали найменувань, для яких підрахунок частоти (імовірності) чи не єдиний тип допустимих математичних операцій. Друга причина — існування добре розробленого математичного апарату трансформації шкал найменувань, іменованого формулою Байєса і забезпечує оптимальність (у сенсі максимізації достовірності) прийнятого рішення:
(1.1)
де P (Yj) і P (Xi) — апріорні ймовірності захворювання Yj та ознаки Xi;
P (Xi / Yj) — умовна ймовірність появи ознаки-симптому Xi для захворювання Yj;
P (Yj / Xi) — апостеріорна ймовірність захворювання Yj при спостереженні ознаки Xi.
Співвідношення (1.1) є одним із правил бази правил експертної системи, що розробляється з використанням елементів байєсівської стратегії.
Відзначимо властивість симетрії формули Байєса: з (1.1) легко вивести співвідношення:
(1.2)
Зіставляючи (1.1) і (1.2), приходимо до висновку, що формула Байєса дозволяє практично за однією і тією ж схемою обчислень здійснювати висновки як у прямому («ознаку захворювання»), так і в зворотному («захворювання ознака») напрямках. Причиною тому — принципова особливість формули Байєса, яка встановлює зв’язок не між «причиною» і «слідством», а між двома довільними подіями. Співвідношення (1.2) можна, в принципі, використовувати для ранжування ознак окремих захворювань (при приватній діагностиці, наприклад). Крім того, зазначена властивість симетрії дозволяє трохи відійти від звичного відстеження причин і наслідків, згадавши про таке явище, як синхронізм явищ у природі (наприклад, один і той же спалах на Сонці може породити як загострення існуючих захворювань, так і послужити «спусковим гачком» для виникнення нових захворювань в ослабленому організмі, тому не слід поспішати оголошувати виявлення залежності як причинно-наслідкові залежності такого роду можуть бути відсутня).
Для безлічі статистично незалежних ознак X = (X1 ,…, XI) формулу Байєса в рекурентному її варіанті
(1.3)
можна розглядати як своєрідний ланцюжок висновків наступного вигляду.
Нехай лікар спостерігає якусь ознаку X1. Виготовляючи обчислення за формулою (1.11), отримуємо апостеріорної розподіл ймовірностей P (Yj/X1), j = 1, …, J, орієнтуючись на максимум якого можемо зробити висновок про наявність деякого захворювання Yj. Символічно правило продукції при цьому можна записати наступним чином: X1 Yj.
Однак значення апостеріорної ймовірності P (Yj/X1) при цьому може виявитися недостатньо високим для впевненого висновку про наявність захворювання. Тоді необхідно за результатами спостереження наступного ознаки X2 повторити обчислення за формулою (1.3), спостерігаючи за змінами максимуму апостеріорного розподілу ймовірностей P (Yj/X1, X2). У загальному випадку цей максимум може зміститися — тоді можемо зробити висновок про наявність іншого захворювання Yr. Схема виведення при цьому набуває вигляду, як показано на рис. 1.1.
Рисунок 1.1 — Схема виведення, коли рівень пошуку змінний Така схема виведення справедлива для випадку, коли рівень пошуку незмінний, це може бути рівень класів захворювань при попередній діагностиці, або рівень нозологічних форм при загальній діагностиці, або рівні диференціальної діагностики.
При переході до все більш детальної діагностики відбувається зміна рівнів, як показано на рис. 1.2.
Рис. 1.2 — Схема виведення для випадку, коли рівень пошуку незмінний Зміна рівня діагностики, природно, приводить до зміни множин симптомів і відповідних їм захворювань. Ланцюжки міркувань, подібні наведеним вище, є прямими ланцюжками, що забезпечують просування від симптомів до захворювань.
Разом з тим, при приватній діагностиці, коли перевіряється припущення про наявність деякого захворювання, виникає необхідність у використанні зворотних ланцюжків міркувань. При цьому обчислення виробляються з використанням співвідношень, подібних[3].
1.3 Правило продукції
Правило продукції «якщо А, то В» («якщо є подія А, тоді є подія В») володіє безперечними перевагами перед іншими формалізмами, оскільки легко сприймається користувачами, зокрема, лікарями при вирішенні задачі діагностики. Схема міркувань при цьому, в першому наближенні, має вигляд: «якщо спостерігається сукупність ознак А, тоді з великою часткою ймовірності має місце група захворювань В» .
Оскільки в самому простому вигляді правило продукції близько за змістом логічної операції імплікації, для правила продукції часто застосовують позначення:
АВ або, трактуючи, А як сукупність деяких заданих умов Pi, i = 1, 2, …, N,
P1P2…Pn B,
де — символ кон’юнкції.
Наведемо приклад правил продукції, застосованих в різних ЕС медичного призначення:
ЯКЩО: профіль щільності є «асиметричний гамма-пік»
і площа під кривою відповідає віковій нормі,
ТО: концентрація гамаглобуліну у межах норми.
Неважко бачити, що подія, А в цьому прикладі є кон’юнкція двох «елементарних» подій, тому цей же приклад можна переписати у вигляді:
ЯКЩО: профіль щільності є «асиметричний гамма-пік»
І
ЯКЩО: площа під кривою відповідає віковій нормі,
ТО: концентрація гамаглобуліну у межах норми.
Система продукцій зручна для вираження знань, які можуть приймати форму переходів між станами (ситуація дію, посилка висновок, причина слідство).
Розрізняють продукційні системи, керовані даними (передумовою правил) і продукційні системи, керовані цілями (діями правил).
База знань продукційної ЕС складається з безлічі правил продукції (бази правил) і кінцевого набору фактів (бази фактів). [4]
1.4 Моделювання логічних міркувань Говорячи про логічні міркування, можна було б очікувати, що під цим мається на увазі лише процес оперування з «медичною пам’яттю» (вихідними даними для такого оперування являються спостерігаючі симптоми). У цьому сенсі «медична пам’ять» є первинною, а логічні міркування — вторинні. Однак попередньо потрібно зауважити, що питання про «первинність» і «вторинність» на перевірку виявляється досить умовним — «стиль» мислення може мати значний вплив на структуру і характер «медицинської пам’яті» .
Найбільше розповсюдження в медицині та психології отримали так звані табличні алгоритми ухвалення рішення — алгоритми, що базуються на обчисленнях з використанням таблиць виду 1.1−1.2. Підсумовуючи для спостережуваних ознак числа, наведені у стовпцях цих таблиць, отримують кілька сум. Діагноз ставлять, орієнтуючись на найбільшу суму.
Перевагами табличних алгоритмів є їх виняткова простота, що дозволяє обходитися без ЕОМ. Недолік — чутливість до ситуацій, коли деякі ознаки не виміряні з тих чи інших причин — може виявитися, що ці ознаки як раз є найбільш інформативними.
В значній мірі вільні від цього недоліку алгоритми, що використовують імовірнісний підхід до прийняття рішення. Обчислення при цьому здійснюються за формулою Байєса або з використанням методу послідовного статистичного аналізу (методу Вальда). Порівняльна складність обчислень передбачає використання ЕОМ.
Таблиця 1.1 — Розподіл вірогідностей захворювань від симптомів
№№ пп.п. | Симптоми | Геморраг., субархної дальн. | Геморраг., в мозок | Геморраг., в шлуночок | Ішеміч., тромбоз | Ішеміч., емболія | |
Сильний головний біль | |||||||
Психомоторне збудження | |||||||
Гіперемія обличчя | |||||||
Блідність обличчя | |||||||
Свідомість збережено | — 10 | ||||||
Свідомість втрачено швидко | |||||||
Кома | |||||||
Артеріал. гіпертонія | |||||||
Артеріал. гіпотонія | |||||||
Пульс напружений | |||||||
Серцева діяльність ослаблена | |||||||
Дихання розладж. | |||||||
. | … | … | … | … | … | … | |
Інфаркт міокарда | |||||||
Ревмокардит | |||||||
Вік до 50 років | |||||||
Вік більше 50 років | |||||||
При обчисленнях за формулою Байєса, як запобіжної достовірності висновку про наявність тієї або іншої патології, використовується умовна ймовірність P (Yj / Xi):
Для безлічі ознак X = (X1 ,…, XI) формула Байєса набуває вигляду:
(1.5)
або, для статистично незалежних ознак,
(1.6)
Вирішальне правило при використанні формули Байєса полягає у пошуку максимуму функції P (Yj / X1 ,…, XI).
Зручніше рекурентний варіант формули Байєса:
(1.7)
що дозволяє проводити обчислення в міру оцінювання нових симптомів, не чекаючи моменту, коли будуть оцінені всі I симптомів. Цей принцип дозволяє припинити облік нових симптомів, якщо лікар вважатиме оцінку ймовірності аналізованої гіпотези досить високою. Слід лише пам’ятати, що формула (1.7) являє собою варіант формули (1.6), тобто математично коректна лише за умови статистичної незалежності ознак.
У окремому випадку діагностики одного з двох можливих захворювань і в припущенні P (Y1) = P (Y2) справедливо співвідношення:
= ,
яке для статистично незалежних ознак можна переписати у вигляді:
=
або, після логарифмування,
= = =. (1.8)
У рекурентній формі:
=. (1.9)
Вирішальне правило в цьому випадку має вигляд:
. (1.10)
У поєднанні з виразом (1.9) це вирішальне правило можна трактувати таким чином: якщо після врахування чергового симптому знак величини uI не змінився, є підстави для припинення процесу діагностики. Хоча «для страховки» можна розглянути ще кілька симптомів, переконавшись, що величина uI дійсно продовжує віддалятися від граничного значення 0.
Недоліком такого роду міркувань є відсутність міри віддаленості величини uI від значення 0, що можна трактувати як можливість свавілля з боку особи, яка приймає рішення — що одному лікарю здасться достатнім, то іншому — ні.
Суть методу послідовного аналізу Вальда полягає в тому, що такий захід вводиться, в результаті чого замість (1.10) використовується вирішальне правило виду:
(1.11)
де величини a і b, що визначають межі «коридору» в межах 0, обчислюються виходячи із заданих значень ймовірностей помилок 1 і 2 — помилок прийняття рішення про захворювання Y1 при наявності захворювання Y2, і навпаки.
Крім того, Вальд строго математично довів доцільність впорядкування діагностичних ознак в порядку зменшення їх інформативності. Втім, теза про необхідність враховувати спочатку більш інформативні ознаки, а потім — менш інформативні, достатньо зрозумілий і на інтуїтивному рівні (з позицій «здорового глузду»).
У практичній діагностиці іноді використовують метод В. С. Генес, сутність якого полягає в тому, що перелік «елементарних» симптомів зводять в один комплексний симптом (синдром) — у цьому випадку обчислення надзвичайно спрощуються, оскільки мова тепер йде про одновимірних щільності розподілів імовірності P (Yj / X) і P (X / Yj). Зауважимо лише, що цей метод застосовується для діагностики невеликої групи захворювань в певному лікувальному закладі в межах чітко вираженого відрізка часу. [5]
Покажемо тепер, що «стиль» мислення при прийнятті рішення дійсно позначається і на формі «медичної пам’яті». Відома, наприклад, діагностична таблиця Сано, що припускає проведення обчислень за формулою Байєса, з тією лише відмінністю, що завдяки логарифмування операція множення замінюється складанням (табл. 1.2).
Стосовно до методу послідовного статистичного аналізу можна використовувати «медичну пам’ять», представлену таблицею 1.3.
При реалізації методу лінійних дискримінантний функцій зручна медична пам’ять, показана в табл. 1.4. Взагалі кажучи, метод лінійних дискримінантний функцій призначений для діагностики двох захворювань, сутність його зводиться до пошуку рівняння площини в багатовимірному просторі ознак. Площина вибирають таким чином, щоб якість рішення задачі діагностики було задовільним у заздалегідь заданому значенні. Один із способів розрахунку дискримінантний коефіцієнтів ai описується співвідношенням:
де — умовне середнє значення симптому Xi при захворюванні Yj; - сумарна дисперсія симптому Xi при обох захворюваннях.
Таблиця 1.2 — Діагностична таблиця Сано
Найменування признаков | Значення признаків | Y1 | Y2 | .. . | Yk | |
X1 | x11 x12 x13 | lnP (x11 /Y1) lnP (x12 /Y1) lnP (x13 /Y1) | .. . .. . .. . | .. . .. . .. . | .. . .. . .. . | |
X2 | x21 x22 | lnP (x21 /Y1) lnP (x22 /Y1) | .. . .. . | .. . .. . | .. . . . | |
Xr | xr1 .. .xrm | lnP (xr1 /Y1) lnP (xrm /Y1) | .. . .. . | .. . .. . | .. . .. . | |
lnP (Xi/Y1) | ||||||
Таблиця 1.3 — Медична пам’ять, стосовно до методу послідовного статистичного аналізу
Найменування признаків | Значення признаків | Ln zi | |
X1 | x11 x12 x13 | .. . | |
.. . | |||
X2 | x21 x22 .. . | .. . | |
.. . | .. . | .. . | |
Таблиця 1.4 — Медична пам’ять, при реалізації методу лінійних дискримінантних функцій
Найменування признаків | Дискримінантні коефіцієнти | Значення признаків | Діагностичні індекси | |
X1 | a1 | x11 x12 x13 | a1x11 a1x12 a1x13 | |
X2 | a2 | x21 x22 .. . | a2x21 a2x22 .. . | |
В таблицях 1.3 та 1.4 наведено медичну пам’ять, стосовно до методу послідовного статистичного аналізу та методу лінійних дискримінантних функцій. 6]
1.5 Приклад ЕС, що реалізують елементи байєсівської стратегії «Експертна система для іридодіагностики ЕСІД»
байєсівський медичний експертний іридодіагностика Комп’ютерна програма ЕСІД розроблена в 1989;91гг. в Київському НВО «Славутич» і являє собою невелику, але разом з тим достатньо потужну і просту в експлуатації експертну систему продукційного типу, що дозволяє здійснювати загальну, диференціальну і приватну іридодіагностіку з використанням елементів байєсівської стратегії. 7]
1.5.1 Призначення та можливості експертної системи для іридодіагностики «ЕСІД»
Програма ЕСІД багатоцільова: вона може використовуватися для практичної іридодіагностики, наукових досліджень та навчання іридологів.
У перелік її можливостей входять:
* кількісна оцінка достовірність можливих захворювань;
* вирішення завдань загальної, диференціальної і приватної діагностики з пошуком інформації за схемами «ознака-захворювання» і «захворювання-ознака» ;
* використання, поряд з ірідодіагностичними, додаткових ознак;
* обгрунтуванням діагнозу;
* автоматизоване формування висновку лікаря з рекомендаціями щодо лікування виявлених захворювань;
* протоколювання результатів обстежень, з можливістю подальшої автоматизованої статистичної обробки протоколів;
* модернізація бази знань без залучення професійних програмістів;
* можливість автоматизованого обліку результатів статистичної обробки протоколів при модернізації бази знань;
* кількість розпізнаваних нозологічних форм — близько 300;
* кількість використовуваних діагностичних ознак — близько 1000;
* наявність режиму «Допомога» у вигляді кольорових графічних ілюстрацій і текстових коментарів. [8]
1.5.2 База знань експертної системи для іридодіагностики «ЕСІД»
Містить систему реляційних баз даних з переліками ірідодіагностичних і додаткових (неірідодіагностичних) ознак, переліками нозологічних форм, інформацією про статистичні зв’язки між ознаками і захворюваннями, рекомендаціями щодо лікування.
Кількість використаних БД — 8, з них 7 постійних, які використовуються для пошуку інформації в прямому напрямі «ознака — захворювання», і одна тимчасова БД — для пошуку інформації у зворотному напрямку «захворювання — ознака». Структура БД зовнішнього огляду, призначеної для зберігання інформації про конституціональні ознаки, має вигляд табл. 1.5. Зауважимо, що в цій таблиці зв’язку між ознаками і станами організму детерміновано — ймовірний характер цих зв’язків відображений у вербальній формі в тексті описів цих станів. 9]
Рисунок 1.3 — База даних Таблица 1.5 — Структура БД зовнішнього огляду, призначеної для зберігання інформації про конституціональні ознаки
Номер зони радужкової оболонки | Номер групи признаків | Ім'я групи признаків | Номер признаку (всередині групи) i | Ім'я признака Xi | Прогноз стану здоров’я Yj1 | Генетичні особливості організму Yj2 | |
Структура БД TAB2-TAB5 має вигляд табл. 1.6. Тут вже імовірнісна залежність між захворюваннями і ознаками задана в числовій формі, у вигляді оцінок умовних ймовірностей P (Xi / Yj) — по суті, це традиційна «медична пам’ять» .
Таблица 1.6 — Структура БД TAB2-TAB5
Номер зони радужкової оболонки | Номер групи признаків | Ім'я групи признаків | Номер признаку (всередині групи) i | Ім'я признака Xi | Номер (код) захворювання j | P (Xi/Yj) | |
Поля №№ 6−7 повторені десятикратно з розрахунку, що одна ознака може відповідати максимум десяти хвороб.
Структура БД PPRIZN показана в табл. 1.7, а БД TEXTKL1 — в табл. 1.8.
Таблица 1.7 — Структура БД PPRIZN
Номер (код) захворювання j | Ім'я захворювання Yj | Номер признаку i | Ім'я признаку Xi | P (Xi/Yj) | Індекс признаку: (0−999) | |
Таблица 1.8 — Структура БД TEXTKL1
Номер (код) захворювання j | Ім'я захворювання Yj | Рекомендації до лікування | |
Процедура модернізації баз знань здійснюється самим користувачем, без допомоги професійних програмістів, і зводиться до редагування БД засобами вбудованої СУБД. При цьому редагування значень умовних ймовірностей P (Xi / Yj) може здійснюватися двома способами:
1) запозиченням із наукової літератури або з інших джерел інформації (думка експертів, особистий досвід та ін);
2) обчислюватися в спеціальному режимі функціонування програми ЕСІД на фактичному матеріалові, накопиченого шляхом пpотоколювання pезультатів обстежень пацієнтів (режим статичного аналізу прецедентів) — такі обчислення проводяться з використанням спеціальної програми SINTEZ.
Можливості СУБД дозволяють користувачу також змінювати переліки ознак та захворювань, редагувати тексти рекомендацій.
Експертна система для іридодіагностики «ЕСІД» побудована дуже змістовним чином, що допомагає здійснити іридодіагностику з використанням елементів байєсовської стратегії. Дана програма є багатоцільовою, так як за допомогою неї можливо не тільки проводити іридодіагностику, а й проводити наукові дослідження та навчання в даній сфері. 10]
Експертні системи, що використовують теорію суб'єктивних ймовірностей широко застосовуються як і в медицині, так і в інших галузях, де потрібно чітко та змістовно визначити ймовірність настання деякої події. Теорія суб'єктивних ймовірностей підпорядкована безпосередньо теорії Байєса. Саме тут вона використовується для оцінки певного завдання, аналізуючи його, даючи тверду відповідь, та складають прогнозування на майбутнє.
2. РОЗРАХУНОК РОЗПОВСЮДЖЕННЯ ЙМОВІРНОСТЕЙ У БАЙЄСОВСЬКІЙ ЕКСПЕРТНІЙ СИСТЕМІ ДЛЯ ДІАГНОСТИКИ ЗАХВОРЮВАНЬ ОРГАНІВ ДИХАННЯ
2.1 Поширення ймовірностей в експертних системах Ймовірність подій поширюється по базі знань (БЗ) експертної системи на основі правила Байєса для обчислення всієї апостеріорної ймовірності гіпотез за умови спостережуваних свідоцтв. Ця апостеріорна ймовірність дає ранжовану інформацію про потенційно дійсну гіпотезу. Припустимо, що в деякій БЗ є всього три взаємно незалежні гіпотези: Н1, Н2, Н3, які мають апріорну ймовірність: р (Н1), р (Н2), р (Н3), відповідно. Правила БЗ містять два умовно незалежні свідоцтва, які підтримують початкові гіпотези в різному ступені. Апріорна і умовна ймовірність всіх гіпотез і свідоцтв прикладу:
Таблиця 2.1 Значення апріорних і умовних ймовірностей гіпотез
р ()/і | ||||
р (Ні) | 0,5 | 0,3 | 0,2 | |
p (Е1|Hi) | 0,4 | 0,8 | 0,3 | |
p (E2|Hi) | 0,7 | 0,9 | ||
За наступною формулою перераховуємо варіативність початкових даних:
Хвих = Хтабл ± а · N, (2.1)
де Хвих — початкове значення нормованої оцінки Р () для кожного студента; Хтабл — значення відповідної нормованої оцінки Р () наведене в таблиці; а — варіативний коефіцієнт, який дорівнює 0,01; N — номер студента згідно журналу. Мій номер за журналом № 9.
Хвих1 = 0,5 + 0,01 * 9 = 0,59;
Хвих2 = 0,3 + 0,01 * 9 = 0,39;
Хвих3 = 0,2 + 0,01 * 9 = 0,29;
але Хвих3 =1 — (0,59 + 0,39) = 0,02, тому що Р (Ні) = 1,
Хвих4 = 0,4 + 0,01 * 9 = 0,49;
Хвих5 = 0,8 + 0,01 * 9 = 0,89;
Хвих6 = 0,3 + 0,01 * 9 = 0,39;
Хвих7 = 0,7 + 0,01 * 9 = 0,79;
Хвих8 = 0,9 + 0,01 * 9 = 0,99;
Хвих9 = 0 + 0,01 * 9 = 0,09;
Перераховану варіативність початкових даних записуємо в наступному виді.
Таблиця 2.2 Перераховані значення апріорних і умовних гіпотез
р ()/і | ||||
р (Ні) | 0,59 | 0,39 | 0,02 | |
p (Е1|Hi) | 0,49 | 0,89 | 0,39 | |
p (E2|Hi) | 0,09 | 0,79 | 0,99 | |
При цьому початкові гіпотези характеризують подію, пов’язану з визначенням надійності деякої хвороби:
Н1 — «пневмонія»
Н2 — «бронхіт»
Н3 — «туберкульоз» .
Подіями, умовно незалежними свідоцтвами, що є, підтримують початкові гіпотези є: Е1 — «висока температура» і Е2 — «кашель» .
В процесі збирання фактів ймовірності гіпотез підвищуватимуться, якщо факти підтримують їх або зменшуватись, якщо спростовують їх. Припустимо, що ми маємо тільки одне свідоцтво Е1 — «висока температура» (тобто з вірогідністю одиниця наступив факт Е1 — «висока температура»). Спостерігаючи Е1 — «висока температура» ми обчислюємо апостеріорну ймовірність для гіпотез згідно формули Байєса для одного свідоцтва:
(2.2)
Таким чином Робимо перевірку, сума апостеріорних ймовірностей повинна дати одиницю:
= 1
Після того, як Е1 — «висока температура» відбулась довіра до гіпотез Н1 — «пневмонія» і Н3 — «туберкульоз» знизилася, тоді як довіра до Н2 — «бронхіт» зросла. У тих випадках, коли є факти, підтверджуючі як подію Е1 — «висока температура» так і подію Е2 — «кашель», то апостеріорна ймовірність початкових гіпотез також може бути обчислена за правилом Байєса:
(2.3)
Оскільки висока температура і кашель умовно незалежні при даних гіпотезах Ні, то формулуБайєса можна переписати у вигляді:
(2.4)
Звідки Перевірка:
Початковим ранжуванням було Н1 — «пневмонія», Н2 — «бронхіт» та Н3 — «туберкульоз», і всі три залишилися після отримання свідоцтва Е1 — «висока температура» і Е2 — «кашель». При цьому бронхіт ймовірніше, ніж пневмонія та туберкульоз. Це свідчить про те, що маючи кашель та високу температуру ймовірність захворювання бронхітом набагато більша, ніж ймовірність захворювання пневмонією чи туберкульозом.
2.2 Послідовне поширення ймовірностей Однак реально, поширення ймовірності відбувається поетапно з підсумовуванням окремих свідоцтв і їх впливу на умовну вірогідність у міру надходження окремих Еі. Це можна зробити, використовуючи апріорну і апостеріорну ймовірність, таким чином:
1. Задаємо р (Ні) — апріорну ймовірність подій Ні.
2. Для одержаних свідоцтв Еj записуємо р (Еj|Ні).
3. З врахуванням теореми Байєса підраховуємо р (Ні|Еj) залежно від результату Еj, тобто обчислюємо апостеріорну ймовірність події Ні.
4. Тепер можна не звертати уваги всі настали Еj і перезначити поточну апостеріорну ймовірність події Ні, як нову апріорну ймовірність Ні. Отже, р (Ні) рівна р (Ні|Еj) залежно від значення Еj.
5. Потім виберемо нове свідоцтво для розгляду і перейдемо до п. 2.
Проілюструємо цю послідовність на приведеному вище прикладі в припущенні, що спочатку поступило свідоцтво Е2 — «кашель». Тоді:
Перевірка:
Одержану ймовірність можна прийняти за нову апостеріорну вірогідність гіпотез Н1, Н2 та Н3, тобто:
) = 0,1394; = 0,8087; = 0,0519
І, якщо тепер додатково поступить свідоцтво Е2 — «кашель», то нова апостеріорна ймовірність гіпотез може бути обчислена тільки на основі свідоцтва, що знов поступило:
Перевірка:
З приведеного прикладу видно, що ітераційна процедура послідовного розподілу ймовірності у міру надходження свідоцтв дозволяє отримати результати аналогічні безпосередньому застосування правила Байєса для випадку одночасного двох свідоцтв, що поступили. Значення гіпотези Н2 — «бронхіт» є найбільш вірогідним, аніж Н1 — «пневмонія» та Н3 — «туберкульоз» .
3. РОЗРОБКА АВТОМАТИЗОВАНОЇ СИСТЕМИ РОЗРАХУНКУ ПОШИРЕННЯ ЙМОВІРНОСТЕЙ У БАЙЄСІВСЬКІЙ ЕКСПЕРТНІЙ СИСТЕМІ ДЛЯ ДІАГНОСТИКИ ЗАХВОРЮВАНЬ ОРГАНІВ ДИХАННЯ
3.1 Обґрунтування інструментарію Електронні таблиці використовуються в комп’ютерній технології близько 15 років. У 80-х роках в нашій країні великого поширення набули табличні процесори Lotus 1−2-3.
До цих пір на малопотужних машинах використовується русифікована версія SuperCalc-4 під назвою Тагро. На сучасних машинах частіше застосовуються більш досконалі програми обробки електронних таблиць, що працюють в графічному режимі під управлінням Windows оболонки, причому в нашій країні найбільш популярні QuattroPro і особливо Microsoft Excel. Досить часто оброблювану інформацію нам доводиться представляти у вигляді таблиць. Така форма роботи завдяки своїй наочності і простоті охоплює практично будь-яку сферу діяльності. Представлення даних в вигляді таблиці істотно спрощує аналіз інформації. Тому автоматизація такого роду операцій значно підвищує якість і ефективність розрахунків.
Документом (тобто об'єктом обробки) Excel є файл, який називається робочою книгою (Workbook). Робоча книга складається з декількох робочих аркушів. На екрані видно тільки один лист. Нижня частина листа містить ярлики інших аркушів. Перерахуємо елементи вікна, специфічні для програми Excel. Верхня рядок — це рядок заголовка, другий рядок — рядок меню, третя і четверта — панелі інструментів, п’ятий рядок включає полі імені (Поточної комірки) і рядок формул. Вся інша область — чистий робочий лист (таблиця), розділений на окремі осередки, утворені на перетині шпальт і рядків. Максимальна кількість рядків 65 536, а стовпців — 256. Рядки пронумеровані цілими числами, а стовпці позначені літерами латинського алфавіту. На перетині стовпця і рядка розташовується основний структурний елемент таблиці - осередок. У будь-яку чарунку можна ввести вихідні дані - число або текст, а також формулу для розрахунку. Кожна чарунка має свою адресу, яка складається з позначення стовпця і номера рядка, на перетині яких ця чарунка перебуває (наприклад, А1, F8, C24 і т. д.). Розміри таблиці дозволяють обробляти величезні обсяги інформації.
Одне з найважливіших функцій програми Excel полягає в можливості виводу на екран дисплея (а потім і на папір) графічних зображень — це діаграми та графіки. Створити діаграму або графік легше за все з допомогою Майстра діаграм. Це функція Excel, яка за допомогою п’яти діалогових вікон дозволяє отримати всю необхідну інформацію для побудови діаграми або графіка і впровадження його в робочий лист.
Для побудови діаграми або графіка необхідно виділити ту частину таблиці, яка використовується для побудови діаграми або графіка і натиснути на кнопку Майстра діаграм, яка знаходиться на панелі інструментів.
3.2 Математичний опис Вводимо в програму Excel розрахункові дані (таблиця 3.1):
Таблиця 3.1 Розрахункові дані
р ()/і | ||||
р (Ні) | 0,59 | 0,39 | 0,02 | |
p (Е1|Hi) | 0,49 | 0,89 | 0,39 | |
p (E2|Hi) | 0,09 | 0,79 | 0,99 | |
Обчислюємо апостеріорну ймовірність для гіпотез згідно формули Байєса для одного свідоцтва:
(3.1)
Для цього в чарунку програми Excel для розрахунку вводимо формулу:
=(B3*B2)/((B3*B2)+(C3*C2)+(D3*D2))
Нажимаємо клавішу Enter, та отримуємо результат 0,4489
Для розрахунку вводимо наступну формулу:
=(C3*C2)/((B3*B2)+(C3*C2)+(D3*D2))
Отримуємо 0,5390
І для обчислення буде така формула:
=(D3*D2)/((B3*B2)+(C3*C2)+(D3*D2))
І результат — 0,0121
Далі робимо перевірку, сума апостеріорних ймовірностей повинна дати одиницю:
В програмі Excel перевірка має вигляд:
=H4+H5+H6
Отримуємо 1
Далі обчислюємо апостеріорні ймовірності початкових гіпотез за правилом Байєса:
(3.2)
Для обчислення вводимо формулу:
=(B3*B4*B2)/((B3*B4*B2)+(C3*C4*C2)+(D3*D4*D2))
Отримуємо результат 0,0845
Для обчислення вводимо наступну формулу:
=(C3*C4*C2)/((B3*B4*B2)+(C3*C4*C2)+(D3*D4*D2))
Результат 0,8904
І для обчислення така формула:
=(D3*D4*D2)/((B3*B4*B2)+(C3*C4*C2)+(D3*D4*D2))
І отриманий результат 0,0251
Перевірка:
=H13+H14+H15
В результаті перевірки отримали 1. Спочатку поступило свідоцтво Е2, тоді: в програмі Excel для обчислення формула має вигляд:
=(B4*B2)/((B4*B2)+(C4*C2)+(D4*D2))
І маємо результат 0,1394
Для така формула:
=(C4*C2)/((B4*B2)+(C4*C2)+(D4*D2))
І результат 0,8087
Формула для обчислення :
=(D4*D2)/((B4*B2)+(C4*C2)+(D4*D2))
Результат 0,0519
Робимо перевірку:
=H23+H24+H25
І отримуємо 1
Одержану ймовірність приймаємо за нову апостеріорну вірогідність гіпотез Н1, Н2 та Н3, тобто:
) = 0,1394; = 0,8087; = 0,0519
І, якщо тепер додатково поступить свідоцтво Е2, то нова апостеріорна ймовірність гіпотез така:
Розрахуємо :
=(B3*G29)/((B3*G29)+(C3*J29)+(D3*M29))
Отриманий результат 0,0845
Формула для :
=(C3*J29)/((B3*G29)+(C3*J29)+(D3*M29))
Результат 0,8905
Розрахуємо :
=(D3*M29)/((B3*G29)+(C3*J29)+(D3*M29))
І отримуємо 0,0250
Далі робимо перевірку:
=H32+H33+H34
Перевірка дала результат 1.
3.3 Розробка інтерфейсу для програми Excel
На Рисунку 3.1 ми бачимо вихідні дані, які ми ввели в програмі Excel для розрахунку.
Рисунок 3.1 — Вихідні дані
Обчислюємо апостеріорну ймовірність для гіпотез згідно формули Байєса для одного свідоцтва, та перевірку. Для цього в програмі Excel для розрахунку, , вводимо формули, як показано на Рисунку 3.2.
Рисунок 3.2 — Введення формул для розрахунку апостеріорної ймовірності для одного свідоцтва Далі обчислюємо апостеріорні ймовірності початкових гіпотез за правилом Байєса і перевірку. Для обчислення, , вводимо формули. Це показано на Рисунку 3.3
Рисунок 3.3 — Введення формул для обчислення апостеріорної ймовірності початкових гіпотез, та перевірка.
Спочатку поступило свідоцтво Е2, тоді в програмі Excel для обчислення, , формули мають вигляд. На Рисунку 3.4 також показана і перевірка.
Рисунок 3.4 — Введення формул в програмі Excel для свідоцтва Е2.
Одержану ймовірність приймаємо за нову апостеріорну вірогідність гіпотез Н1, Н2 та Н3, тобто
) = 0,1394; = 0,8087; = 0,0519
Ці нові дані вводимо в програмі Excel для подальшого використання в обчисленнях.
І, якщо тепер додатково поступить свідоцтво Е2, то для розрахунку нової апостеріорної ймовірності гіпотез будуть формули, як на Рисунку 3.5. Формули для розрахунку, , та перевірки.
Рисунок 3.5 — Введення формул для розрахунку нової апостеріорної ймовірності для гіпотез
3.4 Тестування розробленої системи Рисунок 3.6 — Вихідні дані розрахунку Після введення кожної формули в програмі Excel натискаємо клавішу Enter і отримуємо результат розрахунку, , та результат перевірки, як показано на Рисунку 3.7.
Рисунок 3.7 — Отриманий результат обчислення апостеріорної ймовірності для гіпотез згідно формули Байєса для одного свідоцтва.
На Рисунку 3.8 ми бачимо отриманий результат розрахунку апостеріорної ймовірності початкових гіпотез та результат перевірки Рисунок 3.8 — Результат розрахунку апостеріорної ймовірності початкових гіпотез Спочатку поступило свідоцтво Е2, тоді в програмі Excel результат обчислення, , показаний на Рисунку 3.9 також показаний і результат перевірки.
Рисунок 3.9 — Результат для початкового свідоцтва Е2
Одержану ймовірність приймаємо за нову апостеріорну вірогідність гіпотез Н1, Н2 та Н3, тобто
) = 0,1394; = 0,8087; = 0,0519
Ці нові дані були введені в програму Excel для подальшого використання в обчисленнях.
І, якщо тепер додатково поступить свідоцтво Е2, то результат розрахунку нової апостеріорної ймовірності гіпотез після введення формул, та натискання клавіші Enter буде як на Рисунку 3.10 .
Рисунок 3.10 — Результат нової апостеріорної ймовірності, та перевірка.
Автоматизована система розрахунку поширення ймовірностей у Байєсовскій системі для діагности захворювань органів дихання співпадає з попередніми розрахунками за правилом Байєса для одного і двох свідоцтв.
ВИСНОВКИ Експертні системи, що використовують теорію суб'єктивних ймовірностей широко застосовуються як і в медицині, так і в інших галузях, де потрібно чітко та змістовно визначити ймовірність настання деякої події. Теорія суб'єктивних ймовірностей підпорядкована безпосередньо теорії Байєса. Саме тут вона використовується для оцінки певного завдання, аналізуючи його, даючи тверду відповідь, та складають прогнозування на майбутнє.
В ході розрахунків поширення ймовірностей в експертних системах при заданих гіпотезах, Н1 — «пневмонія», Н2 — «бронхіт», Н3 — «туберкульоз», що характеризують подію, пов’язану з визначенням деякої хвороби, був отриманий результат, що свідчить про вірогідність появи хвороби бронхіту, більше ніж дві інші задані хвороби.
Автоматизована система розрахунку поширення ймовірностей у Байєсовскій системі для діагности захворювань органів дихання співпадає з попередніми розрахунками за правилом Байєса для одного і двох свідоцтв.
Список використаної літератури
1. Кісельов Є.М. Экспертные системи в медицине. Конспект лекций для студентов специальностей 7.09.0804 «Физическая и биомедицинская электроника». — Запорожье: Издательство ЗГИА, 2003. — 120с.
2. Кісельов Є.М. Програмне забезпечення комп’ютерних та електронних біомедичних систем. Методичні вказівки до курсового проектування для студентів ЗДІА спеціальності 7.09.0804 «Фізична та біомедична електроніка». — Запоріжжя: Вид-во ЗДІА, 2006. — 53с.
3. Кісельов Є.М. Програмне забезпечення комп’ютерних та електронних біомедичних систем. Конспект лекцій для студентів ЗДІА спеціальності 7.09.0804 «Фізична та біомедична електроніка». — Запоріжжя: Вид-во ЗДІА, 2005. — 102с.
4. Хили П. М., Джекобсон Є.Дж. Дифференциальный диагноз внутренних болезней: алгоритмический подход. — М.: ЗАО «Издательство БИНОМ», 2002. — 280с.
5. Братко И. Программирование на языке Пролог для искуственного интеллекта: Пер. с англ. — М.: Мир, 1990. — 560с.
6. Уотермен Д. Руководство по експертним системах: Пер. з англ. — М.: Мир, 1989. — 388с.
7. Поспелов Г. С. Искусственный интеллект — основа новой информационной технологии. М.," Наука", 1988. — 269стр.
8. Шишков Д. И. Данные и знания. — Искусственный интеллект, № 1, 1996, с.121−127.
9. Ж. Л. Лорьер. Системы искусственного интеллекта. — М., Мир, 1991, 566с.
10. Продеус А. Н., Сядро Т. А. Проблемы реализации Байесовской стратегии при автоматизации иридодиагностики. Сб. «Электроника и связь», № 2, часть II. — К., НТУУ (КПИ), 1997 г., с.312−316.