Zasady implementacji słowników

A A A

Adres bardzo często pełni rolę łącznika między rejestrami. Warunkiem jest, aby występujące w adresie nazwy jednostek podziału terytorialnego, miejscowości i ulic we wszystkich rejestrach zapisane były w ten sam sposób, zgodnie z nazewnictwem urzędowym. Wykorzystanie w zapisie adresu identyfikatorów terytorialnych umożliwia spełnienie tego warunku. Zastosowanie słowników rejestru TERYT pozwala na przywołanie właściwej, urzędowej nazwy obiektu oraz łączenie danych dotyczących tych samych adresów w różnych systemach czy rejestrach. Ułatwia też znacznie proces aktualizacji tych rejestrów w przypadku zmian nazw jednostek podziału terytorialnego, miejscowości i ulic w rejestrze TERYT, umożliwia wykonanie odpowiedniej aktualizacji w sposób automatyczny, eliminując przy tym ręczne wprowadzanie nazw z klawiatury, które powoduje wielu pomyłek, błędów literowych i przekłamań. Identyfikatory rejestru znajdują też zastosowanie w grupowaniu danych w przekrojach terytorialnych o różnym stopniu szczegółowości.

Przedstawione poniżej wskazówki pozwolą na prawidłową implementację słowników rejestru TERYT.

W zakresie systemu TERC:

  • dla prawidłowego funkcjonowania systemu istotne jest zabezpieczenie w nim odpowiedniej liczby znaków dla pola, w którym przechowywany będzie identyfikator terytorialny; w pełnym zakresie składa się on z 7 znaków, natomiast w zależności od potrzeb może być wykorzystany identyfikator skrócony:
    • 6 znaków (gmina bez rodzaju jednostki oraz podziału na miasto i obszar wiejski),
    • 4 znaki (powiat),
    • 2 znaki (województwo);
    ograniczenie identyfikatora gminy do 6 znaków powoduje utratę informacji o charakterze jednostki, co w niektórych przypadkach utrudnia jej identyfikację (np. w przypadku gmin miejskiej i wiejskiej o takiej samej nazwie, występujących w tym samym powiecie – błędem jest traktowanie gmin miejskich i wiejskich o tej samej nazwie jako 1 rekord), a dla gmin miejsko-wiejskich powoduje dublowanie rekordów (3 rekordy),
  • przy kodowaniu adresów w gminach miejsko-wiejskich należy pominąć rekordy, w których ostatnia cyfra identyfikatora 7-znakowego = 3; w rejestrze TERYT w gminach miejsko-wiejskich, miejscowości i ulice powiązane są z obszarem wiejskim (ostatnia cyfra identyfikatora 7-znakowego = 5) oraz miastem (ostatnia cyfra identyfikatora 7-znakowego = 4),
  • uwzględnianie w strukturze zbioru pola NAZDOD zawierającego określenie jednostki, które podpowiada jej rodzaj, np. powiat, miasto na prawach powiatu, gmina miejska, gmina wiejska, miasto w gminie miejsko-wiejskiej itd.,
  • grupowanie danych:
    • jeśli opracowanie danych wymaga pogrupowania gmin według ich rodzaju, to do kodowania z całej zbiorowości identyfikatorów należy wybrać te, odnoszące się do całych gmin, a więc z symbolem rodzaju jednostki 1 (gminy miejskie), 2 (gminy wiejskie) i 3 (gminy miejsko-wiejskie),
    • jeżeli opracowanie danych wymaga grupowania w układzie miasto-wieś, dla gmin miejsko-wiejskich konieczne jest odrębne kodowanie danych dla miast i terenów wiejskich (wówczas nie należy stosować symboli gmin miejsko-wiejskich jako całości, gdzie ostatnia – siódma cyfra identyfikatora = 3); dla gmin miejsko-wiejskich powinny być stosowane wyłącznie symbole określające części gminy, tj. posiadające na siódmym miejscu cyfrę “4” dla miast lub cyfrę “5” – dla obszarów wiejskich gminy i wówczas:
      • dane dla miast uzyskamy wybierając jednostki, z symbolem rodzaju 1 (gminy miejskie) i 4 (miasta w gminach miejsko-wiejskich),
      • dane dla wsi uzyskamy poprzez grupowanie jednostek z symbolem rodzaju 2 (gminy wiejskie) i 5 (obszary wiejskie w gminach miejsko-wiejskich),
      • dane dla całej gminy miejsko-wiejskiej (symbol rodzaju jednostki = 3) zawsze stanowić będą sumę danych dla miasta (symbol = 4) i danych dla obszaru wiejskiego (symbol = 5),
    • w przypadku m. st. Warszawy dane dla miasta stanowią sumę danych dla dzielnic; aby wykluczyć zdublowanie danych do symbolizacji należy stosować albo jeden identyfikator dla całego miasta (z rodzajem jednostki = 1) albo identyfikatory poszczególnych dzielnic (z rodzajem jednostki = 8); podobna sytuacja odnosi się do gmin: Kraków, Łódź, Poznań i Wrocław, w których istnieją delegatury – dane mogą być symbolizowane albo jednym identyfikatorem dla całego miasta jako gminy z rodzajem jednostki = 1 albo, uwzględniając delegatury, identyfikatorami dla delegatur – z rodzajem jednostki = 9,
    • w przypadku imiennej prezentacji gmin powinny być one podawane albo w podziale na gminy: miejskie, wiejskie i miejsko-wiejskie albo przy nazwach konieczne jest podanie pełnego identyfikatora gminy, określenia jednostki lub dodatkowego oznaczenia w postaci liter: np. m. – przy gminie miejskiej, w. – przy gminie wiejskiej i m-w przy gminie miejsko-wiejskiej; taka potrzeba wynika stąd, że w ramach powiatu niektóre nazwy gmin miejskich i wiejskich są identyczne; niezastosowanie więc dodatkowych oznaczeń przy prezentowaniu imiennym gmin w porządku alfabetycznym może powodować wrażenie błędu wynikające z powtórzenia się nazwy gminy.

W zakresie systemu SIMC:

  • identyfikator miejscowości jest unikalny i niezmienny, może służyć systemom informatycznym jako element łączący zbiory i nie zmienia się pomimo zmian w zakresie nazwy, rodzaju, czy przynależności miejscowości do jednostki administracyjnej; identyfikator ten ma charakter jedynie informacyjny – jego budowa nie pozwala na identyfikację przynależności do jednostki wyższego rzędu,
  • w przypadku miejscowości wiejskich nie należy pomijać części integralnych miejscowości (SYM ≠ SYMPOD) i ograniczać słownika miejscowości wyłącznie do miejscowości podstawowych (pole SYM = SYMPOD) – każda z miejscowości wiejskich, która znajduje się w systemie SIMC powinna zostać uwzględniona, ponieważ może być użyta w adresach – pominięcie części integralnych spowoduje w takich przypadkach brak możliwości rejestracji adresu oraz nie pozwoli na jednoznaczną identyfikację obiektu; ograniczenie słownika do miejscowości podstawowych jest zasadne tylko w przypadku miast (pominięcie miejscowości, dla których rodzaj został określony jako „część miasta” tzn. RM=99),
  • rodzaj miejscowości (wieś, kolonia, osada, przysiółek itd.) jest istotnym elementem określającym miejscowość, w szczególności w sytuacji, gdy w danej gminie występuje kilka miejscowości o tej samej nazwie (nazwy rodzajów gromadzone są w pliku WMRODZ), dlatego nie należy go pomijać,
  • do prawidłowej implementacji katalogu miejscowości konieczne jest pobranie również danych z katalogu TERC i WMRODZ (słownik rodzajów miejscowości).

W zakresie katalogu ULIC:

  • należy zapewnić w systemie odpowiednią liczbę znaków w polu przewidzianym dla nazwy ulicy – w rejestrze TERYT występują ulice o długości nazw powyżej 90 znaków,
  • zapewnienie po stronie odbiorcy aktualności słowników – aktualizacja katalogu ulic następuje w cyklu jednodniowym,
  • identyfikator z katalogu ULIC jest identyfikatorem nazwy ulicy (nie ulicy), nie jest zatem unikalny; ulice o tej samej nazwie (łącznie z cechą) występujące w różnych lokalizacjach mają takie same identyfikatory; ulice o tej samej nazwie, ale różniące się „cechą” (np. ul. Adama Mickiewicza, al. Adama Mickiewicza) posiadają różne identyfikatory; przeniesienie ulicy w wyniku zmian administracyjnych do innej jednostki podziału terytorialnego/miejscowości nie powoduje zmiany jej identyfikatora – zmianie ulegają jedynie jej parametry (informacje o jednostce/miejscowości, w której występuje dana nazwa),
  • pełna nazwa ulicy powstaje poprzez złączenie pól: cecha, Nazwa_2 i Nazwa_1 we wskazanej kolejności (nazwy pól zgodne ze strukturą zbioru katalogu ULIC rejestru TERYT),

    CECHA
    ul.
    NAZWA_2
    Juliusza
    NAZWA_1
    Słowackiego
    ul. Juliusza Słowackiego

      gdzie:
    • cecha – określenie typu: ul., al., pl. itd.,
    • Nazwa_1 – część nazwy ulicy począwszy od wskazanego (istotnego) słowa aż do końca nazwy - stanowi jej klucz, który decyduje o pozycji nazwy w układzie alfabetycznym,
    • Nazwa_2 – część nazwy poprzedzająca słowo kluczowe określana jest jako początek nazwy;
    klucz jest określony dla każdej nazwy ulicy; w szczególnych przypadkach, dla nazw które nie posiadają wyraźnej części o istotnym znaczeniu do wyszukiwania w skorowidzu alfabetycznym, kluczem jest cała nazwa ulicy; w tych przypadkach początek nazwy pozostaje niezdefiniowany,
  • pomijanie pola „cecha” jest uzasadnione tylko w szczególnych przypadkach, tj. w sytuacji gdy pierwsze słowo nazwy podanej w pełnym brzmieniu (określone pełnym wyrazem lub skrótem np. al. Aleja Róż lub al. Al. Róż) pokrywa się z określeniem cechy danej pozycji oraz gdy „cecha” została sklasyfikowana jako „inne”; pominięcie „cechy” w pozostałych przypadkach nie pozwoli na rozróżnienie obiektów występujących w tej samej miejscowości i noszących taką samą nazwę np. ul. Zwycięstwa i pl. Zwycięstwa,
  • projektując system należy mieć na uwadze, że w przypadku miejscowości wiejskich nie ma obligatoryjności stosowania w adresie nazw ulic – w miejscowości może być prowadzona ciągła numeracja porządkowa bez przyporządkowania do ulic lub w ramach siatki ulic; zdarza się też, że w miejscowości występuje tzw. system mieszany, w którym część numerów powiązana jest z ulicami, a część bezpośrednio z nazwą miejscowości; błędem jest zatem zastosowanie rozwiązania, w którym w miejscowościach wiejskich system wymusza wybór ulicy (bez względu na to czy w miejscowości występują już ulice czy też nie),
  • dla zapewnienia kompletu informacji o wszystkich obiektach (identyfikatory i nazwy jednostek podziału terytorialnego, miejscowości, ulic) niezbędne jest połączenie zbiorów TERC, SIMC, WMRODZ i ULIC.