Допомога у написанні освітніх робіт...
Допоможемо швидко та з гарантією якості!

Дерево безпосередніх складових

РефератДопомога в написанніДізнатися вартістьмоєї роботи

Строчный мову деякою ГНС G окреслюється набір всіх кінцевих рядків, отриманих з G і цей набір позначається L (G). Рядок w вважається отриманою з G, якщо w можна отримати при послідовному переписуванні початкового символу P. S, використовуючи правила граматики G. Рядкові мову L (тобто. набір конечнных рядків) називається контексто вільним мовою (КСЯ), якщо є така КСГ, що L (G)=L. L називається… Читати ще >

Дерево безпосередніх складових (реферат, курсова, диплом, контрольна)

Дерево безпосередніх складових

Дерево безпосередніх складових (ДНС) обеспечиваает структурне опис пропозицій. Граматика безпосередніх складових (ГНС) характеризує ДНС. І те й інше тому відіграють істотне значення у фортепіанній обробці природної мови для створення структурних описів пропозиції, які можна використані обробці систем розуміння чи породження промови.

Дерево безпосередніх составляющих:

ДНС кодує ієрархічну структуру пропозиції. Цю інформацію два види: ієрархічна структура групування і синтаксичні категорії цих угруповань.

Предложение.

John wanted to publish the paper. (1).

имеет таку структуру:

(2).

John wanted to publish.

thepaper.

Эта структура то, можливо подано і в скобочной конструкции:

[[John][[wanted][[to][publish][[the][paper]]]]](3).

(2) і (3) описують групування без ідентифікації складових. Такі конструкції називаються «скелетом». Скелети характеризують фразу без позначення вершин дерева. Скелет із визначенням категорій є ДНС, для фрази (1) це буде так.

S.

NPVP.

VP.

NP (4).

NPRVPV.

DET N.

John wanted to publish.

thepaper.

«John» тут є ім'ям власним, що є також групою що підлягає, «wanted» і «publish» — дієслова, «to" — прийменник (точніше «to» має бути названо часткою чи часом), «the» — детерминатор, «paper» — іменник, «the paper» — група іменника, «to publish the paper» — група присудка, «wanted to publish the paper» — теж група присудка, і, нарешті, «John wanted to publish the paper» — пропозицію.

Соответственно скобочная конструкція (3) виглядатиме так:

[S[NR[NPR John]][VP[V to][V publish][NP[DET the][N paper]]]]](5).

Конструкции (4) і (5) зазвичай (але завжди) використовують у системах обробки природного языка.

Грамматика безпосередніх складових (ГНС)

ГНС складається з набору нетермінальних символів (як-от N, V, NP, VP, P. S тощо.) і з набору термінальних символів (таки лексичні одиниці як John «wanted», «to», «publish», «the», «paper» тощо. буд. і з набору правил, що дозволяють переписувати нетермінальні символи в ланцюжок термінальних і нетермінальних симвлов. Якщо це переписування не залежить від контексту, це контексто-независимая граматика (КНГ), інакше — це контекстозависимая граматика (КЗГ). Правило перезапису має таку форму:

А —> Х (6).

где Х — последовательсть термінальних і нетермінальних символів, а, А — нетерминальные.

КЗГ має иследующее правило перезаписи:

ZAW —> ZXW (7).

где X, Z, W — ланцюжка термінальних і нетермінальних символів, а, А — нетерминальные.

В (7) Проте й Х перебувають у оточенні Z і W. Часто ця формула пишеться в виде.

A —> X êZ — W (8).

Деривация в КНГ починається від початкового символу P. S і далі йде до того часу, поки що не застосована останнє правило. Порядок застосування правил не важливий.

S —> NP VP.

NP —> NPR.

NP —> DET N.

VP —> V VP.

VP —> P V NP.

NPR —> John, Mary, Bill.

N —> paper, man, cow.

V —> wanted, meet, want.

P —> to.

DET —> the.

Несколько формальних властивостей ГНС:

Если все правила деякою ГНС G є контекстно об'єднаними, то G називається контекстно вільної граматикою (КСГ). Якщо деякі правила ГНС є контекстно залежними, то G разывается КЗГ.

Строчный мову деякою ГНС G окреслюється набір всіх кінцевих рядків, отриманих з G і цей набір позначається L (G). Рядок w вважається отриманою з G, якщо w можна отримати при послідовному переписуванні початкового символу P. S, використовуючи правила граматики G. Рядкові мову L (тобто. набір конечнных рядків) називається контексто вільним мовою (КСЯ), якщо є така КСГ, що L (G)=L. L називається «суворо контекстно залежним мовою», а то й існує такий КСГ, що КСГ, що L (G)=L, і существунт така КЗГ, що L (G)=L. Зауважте, що граматика G то, можливо контекстнозависимой, та її рядкові мову L (G) не обов’язково має бути КЗЯ. Клас КЗЯ включає клас КСЯ. У цьому сенсі, КЗЯ є як потужним ніж КСЯ.

Однако є й світло інший випадок, коли КЗЯ є більш потужними ніж КСЯ. Якщо деяка КЗГ, G, використовується для «аналізу», у разі мову аналізований при поиощи G — контекстносвободный (6, 7). Щоб пояснити використання КЗГ G для аналізу даного дерева t, визначимо аналіз t так. Груба кажучи аналіз t є якийсь зріз дерева. Дамо точніше визначення: Набір (Pt) для аналізу дерева t визначається так.

1. Якщо t=f (порожній дерево), тоді Pt = f.

2. Якщо t=.

A.

t0t1 …tn.

тогда Pt={A} v P (t0)P (t1)…P (tn) де t0, t1… tn — дерева, А ". «позначає з'єднання; например:

S.

AB.

CdE.

ce.

Pt = {P.S, AB, AE, Ae, CdB, CdE, Cde, cdB, cdE, cde}.

Пусть G — контекстно залежна граматика, тобто. її правила мають форму.

А—>w/p — f.

где, А Î V — P. S (V — алфавіт, і P. S набір термінальних символів), w Î V+ (набір ненульових рядків на безлічі V) і p, f Î V* (набір всіх рядків на V). Якщо p і f — рівні нулю, то таке правило називається контекскносвободным. Дерево t називається «аналізованих «в термінах граматики G, для кожного вузла дерева t виконуються правила G. Контекстно залежне правило А—> w/p — f.

выполняется для вузла Якщо ж рядок відповідна відгалуженню від вузла А, є w і є аналіз t виду r1pАfr2, де r1, r2 Î V*. Контекстне умова p — f називається аналізом предиката.

Наряду з контекстозависимымми правилами правилами, що дозволяє уточняти «правий» і «лівий» контекст, часто необхідно мати правила специфицирующие «верхній» і «нижній» контекст. Маємо вузол, А дерева t, область (p — f), p, f Î V*, містить вузол Якщо ж існує шлях від кореня краю дерева, і має форму.

r1pАfr2 (r1, r2 Î V*).

Контекстное умова, що з таким «вертикальним» аналізом називається «панівним предикатом».

В загальному вигляді правило має форму, А —>w/СА где СА — булева комбінація аналізу та панівних предикатов.

Пусть G — кінцевий набір правив і t (G) — набір дерев, аналізований G. Передбачається, дерева t (G) — пропозиції; тобто. кореневої вузол дерева t (G) вказано початковим символом P. S, а кінцеві вузли — термінальними символами. Покажемо, що рядкові мову L (t (G)) = {x½x, де x терминальная рядок дерева t, і t Î t (G)} контекстно вільний (7).

Пример: Нехай V = {P.S, T, a, b, з, e} і P. S = {a, b, з, e}, і G — кінцевий набір суворих правил.

1. P. S —>e.

2. P. S —> aT.

3. T —> aS.

4. P. S —> bTc / (a_()) Ù DOM (T_).

5. T —> bSc / (a_()) Ù DOM (S_).

Для правил 1, 2, 3 має місце нульової контекст й інші правила — контекстносвободные. У четвертому і п’ятому правилі за умовою потрібно, а зліва і вузол підпорядковується Т (в п’ятому правилі S).

Язык, породжений G, то, можливо породжена G1:

S —> eS —> aT1.

S —> aTT—> aS1.

T —> aST1—> bSc.

S1—>bTc.

Грамматика G1 містить додаткові нетермінальні символи S1 і Т1 для перевірки локального контексту при породженні. Легко помітити, що з допомогою S1 і Т1, досягається гомоморфизм, дозволяє аналізувати будь-яке дерево G1 з допомогою G і навпаки — будь-яке дерево G має гомоморфный прообраз в G1. Розглянемо вкотре контекстно залежне правило (10).

V —> wanted½ -VP.

когда (10) інтерпретується як хибне правило, як описано вище, лексема «wanted» з’являється над вузлом V, лише коли вузол VP перебуває праворуч від неї (в дереві, де з’являється V). Праворуч від V існує рядок, має VP «аналіз». Контекстно-зависимые правила в КГЗ йдуть на аналізу звичайних граматик, а чи не є правила простого переписування рядків.

Терминальные символи в ГНС. Доти термінальні символи були як нереализуемые елементи. Це було зроблено простоти викладу. Термінальні символи є наборами топологічних, синтаксичних і семантичних ознак (4, 8). [У принципі так можливо ліквідувати всі ці ознаки з допомогою введення нових нетермінальних символів. Проте їх кількість буде занадто вже велике (в соответсвии з велику кількість всіх можливих комбінацій цих ознак). І це потягне значне ускладнення граматики]. Наприклад, термінальні символи в (4) вживають складові (комплексні) символи й отримуємо (4').

S.

NPVP.

NPRVVP.

NP.

JohnwantedPV.

+N+VDETN.

— DET-+ - NP[to]publish.

+Animate .+Vthepaper.

+ - NP+ DET+N.

+Definite+ DET ;

+ Singilar.

Здесь не обговорюється можливість зв’язку комплексних символів і проміжних вузлів.

Форма (4') є структурним описом (ЗІ) пропозиції (1):

John wanted to publish the paper.

ГНС в трансформаційної граматиці (ТГ).

ТГ теж обговорюються у цій статті. Проте важливо помітити, що ГНС (і дерева СР) грають значної ролі в ТГ. Основна ідея у тому, деякі структурні описи (СО)описываются в базовому компоненті ТГ, проте інші виводяться з них з допомогою спеціальних правил, званих трансформаціями. Базовим компонентом є ГНС, що визначає набір дерев СР. Дерева, отримані з допомогою трансфомаций також є деревами СР. Такого погляду на ТГ є класичним й, звісно, спрощеним, хоч і достатній для даного описи. Приміром, дерево СР для пропозиції (11), показане на діаграмі (12) — базове. Дерево СР (14) для пропозиції (13), виходить при застосуванні трансформаційного правила.

John saw Mary.

S.

NP.

AUXVP.

NPRVNP.

JohnpastseeNPK.

Mary.

Mary was seen by John.

S.

NPAUXVP.

NPR.

Список литературы

Для підготовки даної праці були використані матеріали із сайту internet.

Показати весь текст
Заповнити форму поточною роботою