Główny Urząd Statystyczny

Zasady implementacji słowników

A A A

Adres bardzo często pełni rolę łącznika między rejestrami. Warunkiem jest, aby występujące w adresie nazwy jednostek podziału terytorialnego, miejscowości i ulic we wszystkich rejestrach zapisane były w ten sam sposób, zgodnie z nazewnictwem urzędowym. Wykorzystanie w zapisie adresu identyfikatorów terytorialnych umożliwia spełnienie tego warunku. Zastosowanie słowników rejestru TERYT pozwala na przywołanie właściwej, urzędowej nazwy obiektu oraz łączenie danych dotyczących tych samych adresów w różnych systemach czy rejestrach. Ułatwia też znacznie proces aktualizacji tych rejestrów w przypadku zmian nazw jednostek podziału terytorialnego, miejscowości i ulic w rejestrze TERYT, umożliwia wykonanie odpowiedniej aktualizacji w sposób automatyczny, eliminując przy tym ręczne wprowadzanie nazw z klawiatury, które powoduje wielu pomyłek, błędów literowych i przekłamań. Identyfikatory rejestru znajdują też zastosowanie w grupowaniu danych w przekrojach terytorialnych o różnym stopniu szczegółowości.

Przedstawione poniżej wskazówki pozwolą na prawidłową implementację słowników rejestru TERYT.

W zakresie systemu TERC:

dla prawidłowego funkcjonowania systemu istotne jest zabezpieczenie w nim odpowiedniej liczby znaków dla pola, w którym przechowywany będzie identyfikator terytorialny; w pełnym zakresie składa się on z 7 znaków, natomiast w zależności od potrzeb może być wykorzystany identyfikator skrócony:
- 6 znaków (gmina bez rodzaju jednostki oraz podziału na miasto i obszar wiejski),
- 4 znaki (powiat),
- 2 znaki (województwo);
ograniczenie identyfikatora gminy do 6 znaków powoduje utratę informacji o charakterze jednostki, co w niektórych przypadkach utrudnia jej identyfikację (np. w przypadku gmin miejskiej i wiejskiej o takiej samej nazwie, występujących w tym samym powiecie – błędem jest traktowanie gmin miejskich i wiejskich o tej samej nazwie jako 1 rekord), a dla gmin miejsko-wiejskich powoduje dublowanie rekordów (3 rekordy),
przy kodowaniu adresów w gminach miejsko-wiejskich należy pominąć rekordy, w których ostatnia cyfra identyfikatora 7-znakowego = 3; w rejestrze TERYT w gminach miejsko-wiejskich, miejscowości i ulice powiązane są z obszarem wiejskim (ostatnia cyfra identyfikatora 7-znakowego = 5) oraz miastem (ostatnia cyfra identyfikatora 7-znakowego = 4),
uwzględnianie w strukturze zbioru pola NAZDOD zawierającego określenie jednostki, które podpowiada jej rodzaj, np. powiat, miasto na prawach powiatu, gmina miejska, gmina wiejska, miasto w gminie miejsko-wiejskiej itd.,
grupowanie danych:
- jeśli opracowanie danych wymaga pogrupowania gmin według ich rodzaju, to do kodowania z całej zbiorowości identyfikatorów należy wybrać te, odnoszące się do całych gmin, a więc z symbolem rodzaju jednostki 1 (gminy miejskie), 2 (gminy wiejskie) i 3 (gminy miejsko-wiejskie),
- jeżeli opracowanie danych wymaga grupowania w układzie miasto-wieś, dla gmin miejsko-wiejskich konieczne jest odrębne kodowanie danych dla miast i terenów wiejskich (wówczas nie należy stosować symboli gmin miejsko-wiejskich jako całości, gdzie ostatnia – siódma cyfra identyfikatora = 3); dla gmin miejsko-wiejskich powinny być stosowane wyłącznie symbole określające części gminy, tj. posiadające na siódmym miejscu cyfrę “4” dla miast lub cyfrę “5” – dla obszarów wiejskich gminy i wówczas:
  - dane dla miast uzyskamy wybierając jednostki, z symbolem rodzaju 1 (gminy miejskie) i 4 (miasta w gminach miejsko-wiejskich),
  - dane dla wsi uzyskamy poprzez grupowanie jednostek z symbolem rodzaju 2 (gminy wiejskie) i 5 (obszary wiejskie w gminach miejsko-wiejskich),
  - dane dla całej gminy miejsko-wiejskiej (symbol rodzaju jednostki = 3) zawsze stanowić będą sumę danych dla miasta (symbol = 4) i danych dla obszaru wiejskiego (symbol = 5),
- w przypadku m. st. Warszawy dane dla miasta stanowią sumę danych dla dzielnic; aby wykluczyć zdublowanie danych do symbolizacji należy stosować albo jeden identyfikator dla całego miasta (z rodzajem jednostki = 1) albo identyfikatory poszczególnych dzielnic (z rodzajem jednostki = 8); podobna sytuacja odnosi się do gmin: Kraków, Łódź, Poznań i Wrocław, w których istnieją delegatury – dane mogą być symbolizowane albo jednym identyfikatorem dla całego miasta jako gminy z rodzajem jednostki = 1 albo, uwzględniając delegatury, identyfikatorami dla delegatur – z rodzajem jednostki = 9,
- w przypadku imiennej prezentacji gmin powinny być one podawane albo w podziale na gminy: miejskie, wiejskie i miejsko-wiejskie albo przy nazwach konieczne jest podanie pełnego identyfikatora gminy, określenia jednostki lub dodatkowego oznaczenia w postaci liter: np. m. – przy gminie miejskiej, w. – przy gminie wiejskiej i m-w przy gminie miejsko-wiejskiej; taka potrzeba wynika stąd, że w ramach powiatu niektóre nazwy gmin miejskich i wiejskich są identyczne; niezastosowanie więc dodatkowych oznaczeń przy prezentowaniu imiennym gmin w porządku alfabetycznym może powodować wrażenie błędu wynikające z powtórzenia się nazwy gminy.

W zakresie systemu SIMC:

identyfikator miejscowości jest unikalny i niezmienny, może służyć systemom informatycznym jako element łączący zbiory i nie zmienia się pomimo zmian w zakresie nazwy, rodzaju, czy przynależności miejscowości do jednostki administracyjnej; identyfikator ten ma charakter jedynie informacyjny – jego budowa nie pozwala na identyfikację przynależności do jednostki wyższego rzędu,
rodzaj miejscowości (wieś, kolonia, osada, przysiółek itd.) jest istotnym elementem określającym miejscowość, w szczególności w sytuacji, gdy w danej gminie występuje kilka miejscowości o tej samej nazwie (nazwy rodzajów gromadzone są w pliku WMRODZ), dlatego nie należy go pomijać,
do prawidłowej implementacji katalogu miejscowości konieczne jest pobranie również danych z katalogu TERC i WMRODZ (słownik rodzajów miejscowości).

W zakresie katalogu ULIC:

należy zapewnić w systemie odpowiednią liczbę znaków w polu przewidzianym dla nazwy ulicy – w rejestrze TERYT występują ulice o długości nazw powyżej 90 znaków,
zapewnienie po stronie odbiorcy aktualności słowników – aktualizacja katalogu ulic następuje w cyklu jednodniowym,
identyfikator z katalogu ULIC jest identyfikatorem nazwy ulicy (nie ulicy), nie jest zatem unikalny; ulice o tej samej nazwie (łącznie z cechą) występujące w różnych lokalizacjach mają takie same identyfikatory; ulice o tej samej nazwie, ale różniące się „cechą” (np. ul. Adama Mickiewicza, al. Adama Mickiewicza) posiadają różne identyfikatory; przeniesienie ulicy w wyniku zmian administracyjnych do innej jednostki podziału terytorialnego/miejscowości nie powoduje zmiany jej identyfikatora – zmianie ulegają jedynie jej parametry (informacje o jednostce/miejscowości, w której występuje dana nazwa),
pełna nazwa ulicy powstaje poprzez złączenie pól: cecha, Nazwa_2 i Nazwa_1 we wskazanej kolejności (nazwy pól zgodne ze strukturą zbioru katalogu ULIC rejestru TERYT),

CECHA

ul.

NAZWA_2

Juliusza

NAZWA_1

Słowackiego

ul. Juliusza Słowackiego
- cecha – określenie typu: ul., al., pl. itd.,
- Nazwa_1 – część nazwy ulicy począwszy od wskazanego (istotnego) słowa aż do końca nazwy - stanowi jej klucz, który decyduje o pozycji nazwy w układzie alfabetycznym,
- Nazwa_2 – część nazwy poprzedzająca słowo kluczowe określana jest jako początek nazwy;
klucz jest określony dla każdej nazwy ulicy; w szczególnych przypadkach, dla nazw które nie posiadają wyraźnej części o istotnym znaczeniu do wyszukiwania w skorowidzu alfabetycznym, kluczem jest cała nazwa ulicy; w tych przypadkach początek nazwy pozostaje niezdefiniowany,
pomijanie pola „cecha” jest uzasadnione tylko w szczególnych przypadkach, tj. w sytuacji gdy pierwsze słowo nazwy podanej w pełnym brzmieniu (określone pełnym wyrazem lub skrótem np. al. Aleja Róż lub al. Al. Róż) pokrywa się z określeniem cechy danej pozycji oraz gdy „cecha” została sklasyfikowana jako „inne”; pominięcie „cechy” w pozostałych przypadkach nie pozwoli na rozróżnienie obiektów występujących w tej samej miejscowości i noszących taką samą nazwę np. ul. Zwycięstwa i pl. Zwycięstwa,
projektując system należy mieć na uwadze, że w przypadku miejscowości wiejskich nie ma obligatoryjności stosowania w adresie nazw ulic – w miejscowości może być prowadzona ciągła numeracja porządkowa bez przyporządkowania do ulic lub w ramach siatki ulic; zdarza się też, że w miejscowości występuje tzw. system mieszany, w którym część numerów powiązana jest z ulicami, a część bezpośrednio z nazwą miejscowości; błędem jest zatem zastosowanie rozwiązania, w którym w miejscowościach wiejskich system wymusza wybór ulicy (bez względu na to czy w miejscowości występują już ulice czy też nie),
dla zapewnienia kompletu informacji o wszystkich obiektach (identyfikatory i nazwy jednostek podziału terytorialnego, miejscowości, ulic) niezbędne jest połączenie zbiorów TERC, SIMC, WMRODZ i ULIC.