Toggle menu

Sapfo – Parafrázovač slovenčiny

Objednávka O knihe O autorovi Obsah

 

Emil Páleš

SAPFO – Parafrázovač slovenčiny

Počítačový nástroj na modelovanie v jazykovede

Vyšlo vo vydavateľstve Veda, Bratislava, 1994, 308 strán,

ISBN 80-224-0109-9.

(Celá kniha v dokumente PDF - 31 MB)

 

 

Objednávka


     Z tejto knihy zostalo už len niekoľko kusov a nebude sa robiť dotlač. Skenovanú verziu si môžete stiahnuť na tejto stránke zadarmo. Originál knihy (pre vysokoškolské knižnice a pod.) si môžete objednať zaplatením 20 € na adresu:

Sophia
P. O. Box 151
810 00 Bratislava 1

Na poukážku do kolónky "správa pre prijímatela" napíšte „Sapfo“.

 

O knihe


     SAPFO (Sense APprehending Frame Operator) je systém na parafrázovanie prirodzeného jazyka. Používateľ zadá vetu či slovnú frázu v slovenčine a program odpovedá množinou slovenských viet (alebo fráz) rozličných foriem, ale významovo blízkych pôvodnej vete/fráze.  Tento systém slúži ako (zjednodušený) experimentálny model ľudského jazykového vedomia. Je založený na psycholingvistickom experimente s počúvaním a prerozprávaním krátkych príbehov ľudskými subjektmi.
     V počítačovej lingvistike bolo navrhnutých množstvo prístupov. No iba máloktoré z nich boli úspešne implementované. Jedným z dôvodov je ten, že čiastkové riešenia rôznych špeciálnych podproblémov sa vyvíjali oddelene jeden od druhého, t.j. bez toho aby jednotliví riešitelia mali v mysli pred očami celok systému. Potom sa ukáže, že jednotlivé procedúry buď nie sú medzi sebou kompatibilné, alebo presúvajú nejaký fundamentálny problém na iné časti systému, alebo očakávajú taký druh vstupu, aký nie je k dispozícii.
     Na druhej strane sú tu niektoré úspešne aplikované systémy, ale ani tie nespĺňajú požiadavku celostnosti. Fungujú spravidla len vďaka radikálnemu ohraničeniu témy diskurzu alebo vďaka sofistikovanej zbierke trikov, takže tiež nie sú platným modelom jazykového vedomia.
     SAPFO je navrhnuté byť modelom jazyka ako celku. Zahŕňa všetky podsystémy jazyka – tvaroslovie (morfológiu), slovotvorbu, vetnú skladbu (syntax), sémantiku, frazeológiu, štylistiku – a umožňuje pozorovať ich pri práci vo vzájomnej interakcii. Program pozostáva z niekoľkých paralelne pracujúcich a komunikujúcich nezávislých modulov (agentov). Každý z nich reprezentuje jeden z podsystémov jazyka.
     V takomto celostnom (emergentnom alebo multi-agentovom) systéme vzniká efekt synergie, ktorý pomáha redukovať vypočtovú zložitosť a zvýšiť kognitívnu silu celého systému.

     Morfologický modul obsahuje úplný deklaratívny popis slovenského tvaroslovia (skloňovania, časovania, stupňovania atď.). Dokáže analyzovať alebo vygenerovať každý slovenský slovný tvar spolu s jeho gramatickými kategóriami.
     Modul syntaxe je rozšírená prechodová sieť so silným sémantickým komponentom. Pokrýva širokú škálu podôb slovenskej vetnej skladby a úzko spolupracuje so sémantickými kolokačnými funkciami.
     Sémantický modul pozostáva z lexikálno-sémantickej informácie, valenčných rámcov slovies, podstatných a prídavných mien ako aj ďalších slovných druhov. Rozhoduje o sémantickej prípustnosti každej syntagmy a komunikuje s ostatnými modulmi prostredníctvom piatich kolokačných funkcií VAL, LVAL, RVAL, CVAL, DVAL (valencia slovies, pravá a ľavá valencia podstatných mien, vnútorná valencia zložených a odvodených slov).
     Modul derivatológie obsahuje bohatý popis slovenskej slovotvorby a odvodzovania slov. Niekoľko sto dynamických pravidiel pokrýva podstatnú časť slovenskej slovotvorby. Tento modul umožňuje rozvinúť zložené slová na vety či substantívne frázy a naopak skondenzovať vety a ich časti do zložených slov.
     Modul frazeológie umožňuje zameniť určité časti vety ekvivalentnými frazeologickými výrazmi a naopak.
     Modul štylistiky kontroluje štylistickú konzistenciu vety. Umožňuje sformovať alebo transformovať vetu podľa rôznych štýlov a dialektov.
     Tieto moduly v súčinnosti dokážu vykonať spolu okolo 70 rôznych typov manipulácií s formou a významom.  Patria k nim transformácie (transpozície gramatických pádov do odlišných povrchových foriem ako pasivizácia, nominalizácia, kompozícia, derivácia, participalizácia, infinitivizácia, apozícia, subordinácia, koordinácia a i.), dominácie (vertikálne preskupenie vetnej skladby), transfigurácie (perspektivizácia sémantických figúr), transmutácie (pridanie alebo uberanie elementárnych komponentov významu ako synonymizácia, antonymizácia, magnonymizácia, deminutivizácia a i.). Systém umožňuje meniť aj intonáciu, ohnisko témy a rémy, štylizáciu a niektoré poetické figúry.

    Používateľ môže voliť, aplikovať a pozorovať parafrázovacie prostriedky z menu-tabuľky jazykových prostriedkov, môže ich zapínať a vypínať po jednom alebo v skupinách.
     Systém slúži ako počítačový nástroj pre lingvistov, ktorí môžu program použiť na testovanie a overovanie rôznych lingvistických hypotéz na veľkých korpusoch textov. Skúsenosť so SAPFO môže v budúcnosti prispieť aj k vývoju aplikovaných informačných systémov pre inteligentný návrat informácie z databáz v prirodzenom jazyku (z internetu).

     Tento systém je jedinečný v slovanských jazykoch.

 

O autorovi


     RNDr. Emil Páleš, CSc., vyštudoval kybernetiku na Matematicko-fyzikálnej fakulte Komenského univerzity v Bratislave. V rokoch 1989-94 vyučoval počítačovú lingvistiku na Katedre umelej inteligencie  a viedol výskumnú úlohu “Počítačový model slovenčiny” na Jazykovednom ústave Ľudovíta Štúra Slovenskej akadémie vied. Jeho model slovenčiny je zakladajúcim dielom slovenskej počítačovej lingvistiky a prvým implementovaným integrálnym modelom slovanského jazyka.

 

Obsah knihy


0.1 O cieli a význame výpočtovej lingvistiky
0.2 Turingov test
0.3 Eliza
0.4 Návrh papagájovacieho stroja
0.5 Parafráza ako kritérium porozumenia
0.6 Skutočný kognitívny model
0.7 Stratifikačná sekvenčná analýza jazyka
0.8 Rozlišovacia hierarchia
0.9 Nejednoznačnosť
0.10 Sekvenčný a paralelný model
0.11 Synergia. Súčinnosť jazykových podsystémov
0.12 Konekcionizmus a subsymbolové výpočty
0.13 Všeobecnosť versus hĺbka
0.14 Experiment Par Ex (Paraphrasing of Expressions)

PRINCÍPY
0.15 Princíp jedno-jednoznačnosti reprezentácie
0.16 Princíp kontrastívnej diferenciácie
0.17 Synergický princíp
0.18 Princíp 51%

SLOVNÍKY
1.1 Údajová a procedurálna časť
1.2 Morfologický slovník
1.3 Lexikálno-sémantický slovník
1.4 Slovník syntaktických väzieb
1.5 Slovník slovotvorných hniezd
1.6 Synonymický a lexikálno-paradigmatický slovník
1.7 Frazeologický slovník
1.8 Štylistický slovník
1.9 Slovník asociatívnych väzieb a konotácií

FONOLÓGIA
2.1 Klasifikácia foném

MORFOLÓGIA
3.1 Potreba morfologickej analýzy
3.2 Definícia morfologickej analýzy a syntézy
3.3 Procedúra analýzy
3.4 Izolácia koreňa
3.5 Hypotézy o rozdelení na koreň a afixy
3.6 Príklad
3.7 Hypotézy o alternáciách
3.8 Minimálna nevyhnutná nedeterministickosť
3.9 Vysvetlivky

SYNTAKTICKÁ ANALÝZA
4.1 Definícia syntaktickej analýzy
4.2 Formálna gramatika
4.3 Chomského hierarchia
4.4 Bezkontextové gramatiky (CFG)
4.5 Syntaktická analýza zhora-nadol
4.6 Syntaktická analýza zdola-nahor
4.7 Výhody a nevýhody anylýzy zhora-nadol a zdola-nahor
4.8 Zmiešaná stratégia. Analyzátor zhora-nadol s listinou
4.9 Gramatika Hornových klauzúl (DCG)
4.10 Čo robí dobrú gramatiku dobrou gramatikou
4.11 Reverzibilné gramatiky
4.12 Prechodová sieť (TN)
4.13 Rozšírená prechodová sieť (ATN)
4.14 Porovnanie generatívnej kapacity sietí a gramatík
4.15 Deterministickosť
4.16 Rozšírené prechodové siete pre slovenský jazyk
4.17 Porovnanie slovenských a anglických ATN
4.18 Oslabenie prediktívnej sily
4.19 (Polo)voľný slovosled slovenčiny
4.20 Polopredikácie vnútri nominálnych fráz
4.21 Koordinácie a elipsy
4.22 Taxonomická vzdialenosť pri riešení výpustiek

SÉMANTICKÁ ANALÝZA
5.1 Sémantická štruktúra vety
5.2 Rozdiel medzi syntaktickými a sémantickými rolami
5.3 Sémantické pády
5.4 K pôvodu sémantických pádov
5.5 Problém voľby sémantických pádov
5.6 Sekundárna špecifikácia sémantických pádov
5.7 Príklady
5.8 Sémantika slovesných fráz
5.9 Valencia
5.10 Intenčné rámce
5.11 Triedy ekvivalencie slovies
5.12 Niektoré slovesné intenčné rámce
5.13 Pádové preferencie
5.14 Sémantika druhotných predložiek. Nešpecifické doplnenia
5.15 Počítadlo povinnej intencie
5.16 Sémantika prísloviek
5.17 Sémantika vedľajších viet
5.18 Kontrastívny príklad
5.19 Kontrastívny príklad
5.20 Protipríklad
5.21 Sémantika nominálnych fráz
5.22 Nominalizácia
5.23 Funkcie LVAL, RVAL
5.24 Prívlastkové vedľajšie vety
5.25 Kontrastívny príklad
5.26 Kontrastívny príklad
5.27 Protipríklady
5.28 Súvetná sémantika
5.29 Príklady
5.30 Protipríklady
5.31 Nepravá parataxa
5.32 Nepravá hypotaxa
5.33 Sémantika infinitívnych fráz
5.34 Sémantika adjektiválnych fráz
5.35 Translokácia vetných členov
5.36 Sémantika doplnku
5.37 Kontrastívny príklad
5.38 Združené pomenovania
5.39 Modálna stavba vety

INTEGROVANÁ SYNTAKTICKO-SÉMANTICKÁ ANALÝZA
6.1 Nárast nejednoznačností pri sekvenčnej analýze
6.2 Paralelná syntakticko-sémantická analýza
6.3 Predvýpočet valenčných polí
6.4 Špecifikum flektívnych jazykov
6.5 Interakcia syntaxe, sémantiky a morfológie. Príklad
6.6 Principiálne ohraničenia sémantických gramatík

DERIVATOLOGICKÁ ANALÝZA
7.1 Potreba slovotvornej analýzy
7.2 Radikálový rozklad
7.3 Funkcie CVAL, DVAL
7.4 Translexikálna syntaktická analýza
7.5 Prelínanie supra- a sublexikálnej úrovne
7.6 Viacznačnosť a vágnosť slovotvorného významu
7.7 Petrifikácia, lexikalizácia, idiomatizácia
7.8 Slovotvorná parafráza na počítači
7.9 Synergický efekt pri slovotvornom parafrázovaní
7.10 Kontrastívny príklad
7.11 Kontrastívny príklad
7.12 Kontrastívny príklad
7.13 Kontrastívny príklad
7.14 Kontrastívny príklad
7.15 Kontrastívny príklad
7.16 Protipríklad
7.17 Štruktúra kolokačných funkcií
7.18 Analógia s chémiou

KONTEXTOVÁ ANALÝZA
8.1 Príklady koreferencie
8.2 Zoznam konštituentov
8.3 Syntaktická forma. Určitosť, zvratnosť, propriálnosť
8.4 Kategoriálne zhody. Osoba, rod, číslo, pád, životnosť
8.5 Stupeň aktivácie
8.6 Inferenčná metóda
8.7 Algoritmus SAPFO
8.8 Problémy

FRAZEOLÓGIA
9.1 Petrifikované a voľné frazeologické jednotky
9.2 Reprezentácia ďalších frazeologických javov

ŠTYLISTIKA
10.1 Štylistický modul
10.2 Štylistické prostriedky lexikálne
10.3 Štylistické prostriedky hláskoslovné
10.4 Štylistická hodnota gramatických tvarov
10.5 Štylistické návestia. Dialekty a archaizmy
10.6 Štylistická hodnota syntaktických konštrukcií

STAVEBNICOVÁ REPREZENTÁCIA VÝZNAMU
11.1 Vlastnosti sémantickej reprezentácie
11.2 Sentence Representation Language (SRL)
11.3 Komponenty významu

SYNTÉZA PARAFRÁZ
12.1 Intonácia
12.2 Transfokácia
12.3 Transformácia
12.4 Príklady transformácií
12.5 Vznik dvojznačných parafráz
12.6 Transdominácia
12.7 Konverzia
12.8 Perspektivizácia
12.9 Faktické pády
12.10 Ambivalencia doplnku
12.11 Selekcia
12.12 Komplexné vetné členy
12.13 Transfigurácia
12.14 Neutralizácia komponentov významu v kontexte
12.15 Transmutácia
12.16 Syntaktické, sémantické a faktické manipulácie s jazykom
12.17 Nesynonymické parafrázovanie I
12.18 Definícia parafrázy
12.19 Nesynonymické parafrázovanie II
12.20 Príklady nesynonymných parafráz
12.21 Rozdiel medzi trans-formáciou, -figuráciou a -mutáciou
12.22 Kovanie čistého významu do foriem
12.23 Veľký príklad
12.24 Strojová poézia

PREHĽAD SYNTAKTICKÝCH, SÉMANTICKÝCH A FAKTICKÝCH MANIPULÁCIÍ
13.1 Transmutácie gramatické
13.2 Transmutácie lexikálno-sémantické
13.3 Transfigurácie
13.4 Transdominácia
13.5 Transformácie syntaktické
13.6 Transformácie kondenzačné
13.7 Transformácie eliptické
13.8 Transfokácia
13.9 Štylizácia
13.10 Básnické figúry

INTELIGENTNÝ NÁVRAT INFORMÁCIE Z DATABANKY
14.1 Problém sémantickej relevancie
14.2 SAPFO ako informačný systém
14.3 Výpočet sémantickej relevancie. Príklad

FREKVENČNÁ ANALÝZA. PRAVDEPODOBNOSTNÁ SELEKCIA PARAFRÁZ
15.1 Kombinatorická explózia počtu parafráz
15.2 Problém voľby
15.3 Fuzzy logika. Spracovanie neistoty
15.4 Pravdepodobnostné váhové koeficienty a ich štatistické určovanie
15.5 Usporiadanie parafráz podľa pravdepodobnosti

VÝPOČTOVÁ ZLOŽITOSŤ ALGORITMOV
16.1 Zložitostné triedy
16.2 Zložitosť vyhľadávania v slovníku
16.3 Zložitosť morfologickej analýzy
16.4 Zložitosť syntaktickej analýzy
16.5 Ako súvisia zložitosť syntaxe, morfológie a slovotvorby
16.6 Suboptimálne riešenia
16.7 Reálny čas výpočtu

ETICKÉ IMPLIKÁCIE VÝSKUMU V UMELEJ INTELIGENCII
17.1 Cieľavedomé rozhodovanie v problémovom priestore
17.2 Poznávanie s ohraničenou časovou a energetickou rezervou
17.3 Hodnoty štruktúrujú nediferencovanosť
17.4 Model umelej inteligencie
17.5 Vznik automatizovaných vzorcov správania
17.6 Vrodené spúšťacie schémy u zvierat
17.7 Naučené spúšťacie schémy u človeka
17.8 Kreativita nad racionalitu alebo srdce nad rozum
17.9 Zúženie a rozšírenie vedomia
17.10 Globálna kríza ľudstva

PRAMENE

SUMMARY

ZUSAMMENFASSUNG

SAPFO. A HIERARCHIC PARAPHRASING ENGINE