Az egyértelműség meghatározása a nyelvtudományban

Ban ben nyelvészet, az egyértelműsítés az a folyamat, amely meghatározza, hogy az a szó egy adott területen használatos kontextus. Más néven lexikális egyértelműsítés.

A számítógépes nyelvészetben ezt a megkülönböztető folyamatot ún szó-értelmű egyértelműsítés (WSD).

Példák és megfigyelések

„Úgy történik, hogy a miénk kommunikáció, különböző nyelvek egyformán lehetővé teszi, hogy az egyes kommunikációs tranzakciókban ugyanazt a szóalakot különböző dolgokra használjuk. Ennek az a következménye, hogy egy adott tranzakció során ki kell találni egy adott szó szándékolt jelentését a potenciálisan kapcsolódó jelentései között. Amíg a kétértelműségek az ilyen többszörös forma-jelentésű asszociációkból adódóan a lexikális szinten gyakran kell megoldani egy nagyobb kontextus segítségével társalgás beágyazva a szót. Ezért a „szolgáltatás” szó különböző jelentéseit csak akkor lehet egymástól megkülönböztetni, ha magán a szón túl is tudunk tekinteni, mint például a „ játékos szolgálata Wimbledonban” és „a pincérszolgálat Sheratonban”. A szójelentések azonosításának ez a folyamata egy diskurzusban általában ismert, mint

instagram viewer

szó értelme egyértelművé tétele (WSD)." (Oi Yee Kwong, Új perspektívák a számítási és kognitív stratégiákról a szóérzék egyértelművé tételére. Springer, 2013)

Lexikális egyértelműsítés és Word-Sense egyértelműsítés (WSD)

"Lexikális egyértelművé tétele legtágabb meghatározása szerint nem kevesebb, mint minden szó jelentésének meghatározása a kontextusban, ami az emberekben nagyrészt tudattalan folyamatnak tűnik. Számítási problémaként gyakran „AI-teljes”-ként írják le, vagyis olyan probléma, amelynek megoldása feltételezi a befejezendő megoldást. természetes nyelv megértés vagy józan ész érvelése (Ide és Véronis 1998).

"A számítógépes nyelvészet területén a problémát általában szóértelmi egyértelműsítésnek (WSD) nevezik, és a következőképpen határozzák meg: annak számítási problémája, hogy egy szó melyik „értelmét” aktiválja a szó használata egy adott szóban kontextus. A WSD lényegében az osztályozás feladata: a szó jelentése az osztályok, a kontextus biztosítja a bizonyíték, és egy szó minden előfordulása egy vagy több lehetséges osztályához van rendelve az alapján bizonyíték. Ez a WSD hagyományos és általános jellemzése, amely a szóértelmek rögzített jegyzéke tekintetében egyértelmű egyértelműsítési folyamatnak tekinti. Feltételezzük, hogy a szavak véges és diszkrét érzékkészlettel rendelkeznek a szótár, lexikális tudásbázis vagy ontológia (utóbbiban az értelemek olyan fogalmaknak felelnek meg, amelyeket egy szó lexikalizál). Alkalmazás-specifikus leltárak is használhatók. Például egy gépi fordítás (MT) beállításban a szófordításokat szóértelmként lehet kezelni, an megközelítés, amely a nagy többnyelvűség elérhetősége miatt egyre inkább megvalósítható párhuzamos corpora amelyek edzésadatként szolgálhatnak. A hagyományos WSD rögzített készlete csökkenti a probléma összetettségét, de léteznek alternatív mezők.. .." (Eneko Agirre és Philip Edmonds, "Bevezetés." Word Sense egyértelműsítése: Algoritmusok és alkalmazások. Springer, 2007)

Homonímia és egyértelműsítés

"Lexikális egyértelművé tétele különösen alkalmas az esetekre homonímia, például előfordulása basszus le kell képezni a bass lexikai elemek egyikére₁ vagy basszus₂, a szándékolt jelentéstől függően.

"A lexikális egyértelműsítés kognitív választást jelent, és olyan feladat, amely gátolja a megértési folyamatokat. Meg kell különböztetni azoktól a folyamatoktól, amelyek a szóérzékek differenciálódásához vezetnek. Az előbbi feladatot meglehetősen megbízhatóan hajtják végre sok kontextuális információ nélkül is, míg az utóbbit nem (vö. Veronis 1998, 2001). Azt is kimutatták, hogy a homonim szavak, amelyek egyértelműsítést igényelnek, lelassítják a lexikális hozzáférést, míg a sokféle szóérzéket aktiváló poliszém szavak felgyorsítják a lexikális hozzáférést (Rodd e.a. 2002).

Mindazonáltal mind a szemantikai értékek produktív módosítása, mind a lexikálisan különböző elemek közötti egyszerű választás közös, hogy további, nem lexikális információra van szükségük." (Peter Bosch, "Produktivitás, poliszémia és predikátum indexálitás". Logika, nyelv és számítás: 6. Nemzetközi Tbiliszi Szimpózium a logikáról, nyelvről és számításokról, szerk. írta: Balder D. tíz Cate és Henk W. Zeevat. Springer, 2007)

A lexikális kategória egyértelműsítése és a valószínűség elve

"Corley és Crocker (2000) egy széles körű modellt mutat be lexikális kategóriaegyértelművé tétele alapján Valószínűség elve. Konkrétan azt javasolják egy szavakból álló mondathoz w₀... w_n, a mondatfeldolgozó elfogadja a legvalószínűbb beszéd része sorrend t₀... t_n. Pontosabban, modelljük két egyszerű valószínűséget használ ki: (én) a szó feltételes valószínűsége w_én adott beszédrésznek t_én, és (ii) annak a valószínűsége t_én adott az előző beszédrésznek t_i-1. Amint a mondat minden egyes szavával találkozik, a rendszer hozzárendeli azt a beszédrészt t_én, ami maximalizálja e két valószínűség szorzatát. Ez a modell kamatoztatja azt a sok belátást szintaktikai a kétértelműségeknek lexikális alapjuk van (MacDonald et al., 1994), mint a (3) pontban:

(3) A raktári árak/márkák olcsóbbak, mint a többi.

"Ezek a mondatok átmenetileg kétértelműek egy olyan olvasat között, amelyben árak vagy teszi az a fő ige vagy része a összetett főnév. Miután egy nagy korpuszon betanították, a modell megjósolja a beszéd legvalószínűbb részét árak, helyesen figyelembe véve azt a tényt, hogy az emberek megértik ár főnévként de teszi igeként (lásd Crocker & Corley, 2002 és az ott hivatkozott hivatkozásokat). A modell nemcsak a lexikális kategóriában gyökerező egyértelműsítési preferenciák körét veszi figyelembe A kétértelműség azt is megmagyarázza, hogy az emberek általában miért nagyon pontosak az ilyen kétértelműségek feloldásában." (Matthew W. Crocker, "Rational Models of Comprehension: Addressing the Performance Paradox". Huszonegyedik századi pszicholingvisztika: Négy sarokkő, szerk. Írta: Anne Cutler. Lawrence Erlbaum, 2005)