Demokracja pod lupą AI
Niezależny projekt społeczny, który automatyzuje analizę dokumentów samorządowych gminy Piława Górna. Cel: dostarczyć mieszkańcom przystępną wiedzę o tym, co dzieje się w ich mieście — bez konieczności przedzierania się przez urzędowy język setek stron PDF.
Co znajdziesz na tej stronie
Sesje Rady Miejskiej
Pełne transkrypcje nagrań wideo z diaryzacją mówców, streszczenia AI, informacje o uchwałach i frekwencji. Każda sesja to gotowy raport — kto mówił, o czym, ile czasu i jak głosował.
Interpelacje radnych
Pytania radnych do Burmistrza z VII i VIII kadencji (2018–2029). Filtrowanie po radnym, roku, kategorii. Każda interpelacja ma streszczenie AI: o co pytał radny i co odpowiedział Burmistrz.
Zarządzenia Burmistrza
Decyzje wykonawcze Burmistrza od 2024 roku. Wyszukiwarka pełnotekstowa, filtry, streszczenia AI pisane językiem zrozumiałym dla każdego mieszkańca — bez żargonu urzędowego.
Jak to działa — pipeline danych
Pobranie danych
Scraper pobiera nagrania wideo sesji, dokumenty PDF z BIP (protokoły, uchwały, zarządzenia, interpelacje).
Transkrypcja i OCR
Nagrania → tekst (MLX Whisper + pyannote). Dokumenty PDF → tekst (pypdf + Gemini dla skanów).
Analiza Gemini
Teksty trafiają do modelu Gemini, który generuje streszczenia, wyciąga fakty i kluczowe informacje.
Publikacja
Dane zapisywane do JSON, strona generowana statycznie przez Astro — szybka, bez serwera i bazy danych.
Największe wyzwanie — odczyt dokumentów PDF
Na pozór proste zadanie — „pobierz treść z PDF" — w praktyce bywa bardzo trudne. Dokumenty samorządowe w BIP to mieszanina różnych formatów i jakości:
Starsze protokoły i zarządzenia są często skanami ręcznie pisanych dokumentów. Standardowe narzędzia do ekstrakcji tekstu (pypdf) zwracają pusty ciąg — dokument istnieje, ale jest obrazem.
Część dokumentów to skany z kserokopiarki — przekrzywione, niewyraźne, z artefaktami. OCR na takim materiale daje błędy literowe, błędnie rozpoznane cyfry i kwoty w budżetach.
Załączniki budżetowe zawierają rozbudowane tabele — ich odczyt bez znajomości struktury daje bezużyteczną miazgę liczb i liter bez kontekstu.
Jak sobie z tym radzimy
Najpierw próbujemy wyodrębnić tekst ze struktury PDF. Jeśli zwraca wystarczającą liczbę znaków — dokument jest cyfrowy i nie potrzebuje OCR.
Gdy pypdf zwraca pusty lub bardzo krótki tekst, strony PDF konwertujemy na obrazy i wysyłamy do Gemini z prośbą o odczyt i streszczenie. Model radzi sobie nawet z ręcznym pismem — choć nadal nie bezbłędnie.
Streszczenia wygenerowane bez pełnego tekstu źródłowego są oznaczane jako mniej wiarygodne. Zawsze wskazujemy link do oryginału w BIP — żeby każdy mógł sprawdzić sam.
Streszczenia AI są pomocą, nie zastępstwem dokumentu urzędowego. Zawsze podajemy link do źródła.
Silnik Systemu
Częste Pytania
Czy to oficjalna strona Gminy?
Nie. To oddolna inicjatywa mieszkańców. Oficjalne dokumenty zawsze w Biuletynie Informacji Publicznej.
Jak dokładne jest AI?
Streszczenia AI są uproszczeniem. Kluczowe liczby i fakty warto zawsze zweryfikować klikając link „BIP" przy każdym dokumencie. Miejsca oparte wyłącznie na OCR ze skanu mogą zawierać błędy rozpoznawania tekstu.
Skąd biorą się dane?
Wyłącznie z publicznych źródeł: BIP gminy Piława Górna, nagrania wideo posiedzeń oraz dokumenty PDF udostępnione przez urząd w ramach dostępu do informacji publicznej.
Nota Prawna
Niniejszy serwis ma charakter informacyjny. Prezentowane treści są generowane automatycznie i mogą zawierać uproszczenia lub błędy OCR. Nie stanowią oficjalnego dokumentu urzędowego w rozumieniu przepisów prawa. Zawsze podajemy link do źródłowego dokumentu w BIP.