MeWeX - Interfejs webowy do wydobywania z korpusów kolokacji w języku polskim

MeWeX - Web tool for colocation extraction in Polish texts

Użyte narzędziaUsed tools

Konwerter plików do tekstu Apache Tika

Apache Tika

Analizator morfologiczny Morfeusz 2 ze słownikiem SGJP, używany tagset: NKJP

Morfeusz 2 with SGJP dictionary (for morphological analysis)

MeWeX

InstrukcjaInstructions

1

Należy przeciągnąć plik w formacie ZIP zawierający pliki txt, doc,docx, pptx, xlsx, odt, pdf, html, rtf

Drop zip file from local disk. The following formats are accepted: txt, rtf, doc, docx, odt, xlslx, pdf. File size is limited

2

Wybrać przycisk "przetwórz"

Click "Process" button

3

Po wykonaniu analizy wyświetli się link do załadowania wyników

Upon completion data will be displayed below

OpcjeOptions

Funkcja dyspersji: Dispersion function:

Miara ekstrakcji: Extraction measure:

Typy strukturalne: Structural types:

Adres pliku (zip)

URL of zip file

Przykładowe korpusy

Example corpora

Korpus dSpace

dSpace corpus

Wybrano: "Żeromski"

Źródło plików - publiczne korpusy serwisu CLARIN-PL dSpace

Files source- public corpora of CLARIN-PL dSpace service

Wczytywanie danych...Loading data...

Źródło plików- Twoje prywatne pliki przechowywane w serwisie CLARIN-PL Nextcloud. Files source- your private files stored in CLARIN-PL Nextcloud service.

Wynik

Result

Ranking IlośćQuantity RelacjaRelation KolokacjaCollocation Forma zlematyzowanaLemmatized form Wszystkie formyAll forms