[QueryPL] by kravietZ                                               15.01.96
                                                                    (Mazovia)



                           Narzdzie do rozpoznawania
                           standardw polskich znakw
                                      v1.0



QueryPL v1.0 jest programem freeware, rozprowadzanym wraz z kodem
rdowym. Suy do rozpoznawania standardu kodowania polskich znakw
w plikach tekstowych, jeli standard ten jest nieznany lub niepewny.

:SKADNIA:
~~~~~~~~~~

             qpl <plik> [-s | -v | -b]

Jako pierwszy argument podaje si zawsze plik ktry ma by sprawdzony.
Po nazwie pliku mog nastpowa dwa opcjonalne argumenty:

        -s      uycie metody statystycznej, generalnie pewniejszej
                i koniecznej w niektrych wypadkach; patrz rozdzia
                ALGORYTM i UWAGI nr 3.

        -v      wywietlenie szczegowych informacji o pracy programu,
                tabeli zgodnoci itp.

        -b      podanie wyniku analizy w postaci parametru dla
                programu ConvPL - cyfry lub litery; opcji tej mona
                uzy do automatycznego konwertowania plikw
                o nieznanym standardzie, podstawiajac uzyskany znak
                do linii polece CPL jako standard rdowy; patrz
                dokumentacja ConvPL; opcja -b automatycznie wycza
                opcj -v

:ALGORYTM:
~~~~~~~~~~
Zasada dziaania jest nastpujca: zliczane s wszystkie wystpienia
wszystkich polskich znakw narodowych. Poniewa znaki powtarzaj si
w rnych standardach, takie wystpienia s zliczane oddzielnie
dla kadego ze standardw. Nastpnie wystpienia wszystkich znakw
s sumowane w obrbie standardw. Wygrywa standard, w ktrym zmiecio
si wicej znakw.

Moe si zdarzy e w tekcie bd wystpowa znaki nie majce funkcji
znakw diakrytycznych (np. jako elementy tabelki), ale nalece do ktrego
z licznych standardw. W pewnych przypadkach mog one zmieni wynik analizy
zwykych zlicze, prowadzc do zego wyboru standardu. Dla zapobieenia
temu QPL moe dodatkowo wykorzysta wiedz o tym, jak czsto kady z
znakw diakrytycznych wystpuje w normalnym, polskim tekcie. Metod
statystyczn wcza si opcj -s.

W tym wypadku przed zsumowaniem zlicze kade z nich zostanie pomnoone
przez odpowiedni wspczynnik, wskazujcy z jak czstotliwoci dana
litera zwykle wystpuje. Tabel zlicze znakw dla obu metod wywietla
opcja -v.

Opcji -s naley uywa do tekstw, w ktrych poza normalnymi polskimi
znakami wystpuj inne znaki, mogce by znakami diakrytycznymi w jakim
innym standardzie. Warto si te upewni, gdy metoda standardowa daje
w wyniku jaki rzadki i niespotykany standard.

:UWAGI:
~~~~~~~
1) Winietka programu i wszystkie informacje s wywietlane na stderr,
dziki czemu s "niewidzialne" przy zrzucaniu wyjcia do pliku,
filtrowaniu itp. Tabela zgodnoci (-v) i wynik - parametr dla ConvPL (-b)
s natomiast wywietlane na stdout.

2) QPL jest rozprowadzany razem z konwerterem ConvPL. Zdecydowaem si
na rozprowadzanie go w postaci odrbnego programu z powodw praktycznych.
Jako taki, moe on mie wiksze moliwoci, wicej zastosowa i bogatsz
lini polece.

3) Rozrnienie standardw DHN i Logic jest trudne, bo skadaj si one
z tych samych znakw, a jedynie cztery z nich s zamienione kolejnoci.
QPL zazwyczaj trafnie rozpoznaje rnic przy uyciu metody statystycznej
(-s), jednak w wyniku podaje obie moliwoci. Druga z nich jest mniej
prawdopodobna, ale zaley to od samego tekstu.
              
Historia:
1.0     pierwsza wersja

..............................................................................
Autor            : Pawel Krawczyk <kravietz@pipeta.chemia.pk.edu.pl>
                                  <2:486/18.4@fidonet>
Najnowsza wersja : ftp://pipeta.chemia.pk.edu.pl/pub/convpl/cpl200.zip

