Na Google na hasło: analiza morfologiczna na pierwszej stronie są odrazu
chyba ze dwie prace dyplomowe. Czy wyczerpałeś możliwości googlowe?
[..] Nie staramy sie tu nasladowac procesow percepcyjnych
ludzkiego mozgu. Pewnie lepiej nawalaby sie do tego siec
neuronowa ;)
Co do zastosowan: przede wszystkim systemy wyszukiwawcze.
polskie wyszukiwarki "cierpia" na wrazliwosc "morfologiczna".
dla jezyka angielkiego za to google swietnie sobie z tym
radzi. Inne zastosowanie: na politechnice warszawskiej
postaje szereg systemow NLP, gdzie analizotor morfologiczny
jest I stopniem analizatora. to nic, ze niektore wyrazy moga
byc wieloznaczne, o tym juz pisalem.
dobry analizor morfologiczny znajdziemy tez u tworcow
Translatica'i.
Analizator morfologiczny - zgoda może mieć zastosowanie. Zainteresowałeś się
(piszesz też, że nie jesteś specjalistą) tymi problemami. Moje zdanie jest
takie, że za pomocą takiego analizotora zrobimy napewno jakąś aproksymację.
Napewno taki analizator pomoże w niektórych sprawach. Ale w pewnym miejscu
jego użyteczność się kończy. Zwróć uwagę, że podejście takie to bardzo typowe
podejście mechaniczne przy przetwarzaniu napisów. I idąc taką drogą ścieżka
urwie się w pewnym momencie. Nie odbieraj tego co piszę w taki sposób, że nie
należy się tym zajmować. Wprost przeciwnie koniec ścieżki powinnismy poznać
bo taki cel też może być bardzo interesujący.
Nasze "komputerki" są już na tyle dobre, że "trzymanie" całego słownika w
pamięci to żaden problem. Opracowanie cząstek słowotwórczych na przykład dla
50 tys słów to żaden problem. Zgromadzenie wszystkich słów w najróżniejszych
odmianach, formach, czasach, to też żaden problem. Co chcę powiedzieć ? -
Chce powiedzieć, że takie podejście cały czas będzie generować aproksymację i
zawsze będzie czegoś brakować.
Twoje pytanie - w pierwszym poście o najbardziej wydajny algorytm analizy
morfologicznej ?, - do dyspozycji masz tylko algorytmy deterministyczne!, - a
więc musisz zgromadzić albo wszystkie formy słownikowe, albo podać algorytmy
transformacji dla słów, zwrotów aby móc je badać, ustalać czym są. Lub mieć
to i to w jakichś proporcjach. Dla słów wieloznaczych dodatkowo musisz
analizować kontekst i to może być już trudne a nawet niewykonalne w 100%. Nie
ma innych dróg dla metod mechanicznego przetwarzania napisów.
Pozdrawiam
Edyl.
PS
Nie przejmuj się, ale czasem powstają jakieś zbędne dyskusje, najczęściej o
niczym, ale to taki urok tego i innych FOR z okolicy.