W pierwszej części artykułu poświęconego importowi danych z plików PDF zajęliśmy się prostszym przypadkiem, czyli importem PDF-a tekstowego (BzG 4/2024).
Nieco trudniejszym zadaniem jest import dokumentów zapisanych w formie obrazów, czy jak kto woli „skanów”. Chodzi o to, że po otwarciu takiego PDF-a teksty co prawda widzimy, ale nie możemy ich zaznaczyć myszką i skopiować do schowka. Oczywiście z łatwością ten tekst odczytamy. My, ludzie, ale nie maszyna. Jeśli więc chcemy mieć edytowalny kosztorys, to co nam pozostaje? Przepisać wszystko ręcznie? Niekoniecznie. Norma EXPERT, dzięki wbudowanemu modułowi OCR (ang. Optical Character Recognition) potrafi, podobnie jak człowiek, rozpoznać tekst umieszczony na obrazach, rysunkach, zdjęciach. Oczywiście w tym przypadku proces konwersji jest z jednej strony nieco dłuższy, a z drugiej obarczony większą ilością błędów w porównaniu do plików tekstowych. Nadal jednak zajmie ułamek czasu, który spędzilibyśmy na przepisywaniu treści kosztorysu w Normie, a błędów zapewne byłoby jeszcze więcej.

Jak zaimportować PDF graficzny

Tradycyjnie otwieramy plik ze strony startowej programu (Kask) wybieramy Import PDF, Excel i po naciśnięciu klawisza Otwórz

zrzut ekranu Norma EXPERT

program wykrywa, że ma otworzyć zeskanowany dokument. Otwiera się okno Importera skanów.

zrzut ekranu Norma EXPERT

W pierwszym kroku wybieramy strony, które mają być importowane – Wybór zakresu stron. 
Jeżeli w jednym pliku będzie przedmiar i kosztorys ofertowy, to należy wybrać strony z jednym typem dokumentu. Powinny być zaznaczone strony zawierające taki sam układ tabelaryczny. 

Najeżdżając wskaźnikiem myszki na miniaturkę strony zostanie ona wyświetlona w dużym oknie. Dodatkowo możemy użyć rolki myszki, aby powiększyć widok strony.

Odznaczamy strony, które chcemy pominąć i klikamy na klawisz OK.

Ulepszanie skanu

Przechodzimy do Analizy wybranych stron.

To jak program poradzi sobie ze zeskanowanym dokumentem, zależeć będzie przede wszystkim od jakości skanu. Podczas analizy stron wykrywane są tabele, nagłówki stron oraz rozpoznawany jest tekst.

W przypadku skanów kiepskiej jakości, gdzie wystąpił problem z rozpoznawaniem linii kolumn oraz wierszy, mamy możliwość ręcznego ich uzupełnienia i poprawienia. Na zakładce Skan możemy:

  • zmieniać położenie pojedynczych linii (po najechaniu kursorem na linię i przytrzymaniu lewego przycisku myszy),
  • korygować rozmiary całej siatki (po ustawieniu wskaźnika myszy na rogu tabeli i przesunięciu go na właściwe miejsce),
  • dodawać lub usuwać linie (po wybraniu jednej z opcji menu Tabeli).

Aby ułatwić kosztorysantom pracę, wprowadzono przyciski umożliwiające manipulowanie skanem.

zrzut ekranu Norma EXPERT

Przyciskiem Obróć w lewo obracamy obraz skanu w lewo o 90 stopni.

Przyciskiem Obróć w prawo obracamy obraz skanu w prawo o 90 stopni.

Przycisk Marginesy otwiera okno edycji marginesów strony, w którym można ograniczyć obszar brany pod uwagę podczas wykrywania tabeli i tekstu. Funkcja ta przydaje się, zwłaszcza gdy na brzegach strony znajdują się zabrudzenia lub zagięcia zakłócające proces rozpoznawania tabel i tekstu.

zrzut ekranu Norma EXPERT

Polecenie Wyprostuj stronę ustawia stronę pionowo i powinno być użyte wtedy, gdy wiemy, że na stronie jest tabela, lecz nie została rozpoznana przez program.

Z kolei Wyzeruj obrót obrazu przywraca obraz do oryginalnego położenia sprzed wykonania ręcznego obracania lub prostowania strony.

Poleceniem Obrót obrazu dokonamy ręcznego obrócenie obrazu o maks. 10 stopni w prawo lub lewo w celu wyprostowania strony.

Poprawianie tabel

W grupie Tabela mamy do dyspozycji polecenie Tabela, które pozwala na wstawienie lub usunięcie tabeli z obrazu skanu oraz polecenie Sprawdź nagłówki badające spójność nagłówków tabel.

zrzut ekranu Norma EXPERT

W przypadku użycia polecenia Wstaw tabelę należy ją ręcznie dopasować do tabeli skanu. W przypadku kasowania mamy do wyboru Usuń tabelę lub Usuń wszystkie tabele. 
Polecenie Sprawdź nagłówki przeprowadza analizę spójności nagłówków tabel na wszystkich importowanych stronach. Jeśli są różne, proponuje ich poprawienie w oknie Porównanie nagłówków, a jeśli są jednakowe – informuje o tym użytkownika. 

zrzut ekranu Norma EXPERT

W grupie Strona, przycisk Wykryj tabelę na stronie uruchamia proces analizy skanu bieżącej strony i wykrywania wierszy i kolumn tabeli.

Poprawianie tekstów

Przycisk Rozpoznaj tekst uruchamia proces analizy skanu i rozpoznawania tekstu na bieżącej stronie, przełącza na widok Skan i tekst, aby było widać wyniki tego rozpoznania.

W menu grupy Menedżer możemy dokonać Resetu wszystkich stron, który anuluje wszystkie zmiany marginesów, obroty, rozpoznaną tabelę i słowa i przywraca strony do stanu oryginalnego. A także Usuń pliki z wynikami poprzednich analiz, co powoduje usunięcie tymczasowych plików, w których trzymana jest informacja o danych analitycznych wcześniej importowanych skanów. 

W menu grupy Strona przy użyciu polecenia Parametry wykrywania tabel możemy określić minimalną długość linii oraz minimalną odległość między tabelami, które są pamiętane indywidualnie dla każdej strony. Zmian dokonujemy, gdy przy ustawieniach domyślnych tabele wykrywane są źle lub wcale.

zrzut ekranu Norma EXPERT

W przypadku Parametrów rozpoznawania tekstu, też z grupy Strona, wyświetli się nam okno z ustawieniami rozpoznawania tekstu, wartością rozdzielczości obrazu oraz opcją wykrywania tekstu tylko we wnętrzu tabel.

zrzut ekranu Norma EXPERT

Wybierając zakładkę Tekst, mamy podgląd rozpoznanego tekstu na stronie. Tekst nierozpoznany jest podświetlany na czerwono.

W menu grupy Tekst znajduje się przycisk Edytuj słowo, przy pomocy którego można dokonać zmian w zaznaczonym słowie. Z kolei, gdy któryś z wyrazów nam nie pasuje, można go usunąć po kliknięciu na przycisk Usuń zaznaczone słowa (jednocześnie można zaznaczyć do skasowania kilka słów). Aby zaznaczyć jedno słowo, wystarczy kliknąć na nim lewym przyciskiem myszy, aby zaznaczyć wiele słów, należy klikać na nich przy naciśniętym klawiszu Shift lub Ctrl lub ciągnąć lewym przyciskiem myszy, zakreślając wokół nich prostokąt.

zrzut ekranu Norma EXPERT

Po poprawieniu tekstu, klikamy na klawisz OK.

Teraz wszystkie strony gotowe są do importu.

Po kliknięciu na ikonkę OK, przechodzimy z powrotem do okna Importu skanów i klikamy na Podgląd

zrzut ekranu Norma EXPERT

Nastąpi analiza nagłówków.

zrzut ekranu Norma EXPERT

Korygowanie nagłówków

Program wykrył niespójności w nagłówkach tabel - należy je skorygować (mogliśmy to też zrobić przy Analizie wybranych stron).

zrzut ekranu Norma EXPERT

Wybieramy stronę, która posłuży jako wzorzec dla pozostałych.

zrzut ekranu Norma EXPERT

Akceptujemy.

zrzut ekranu Norma EXPERT

Jeżeli w dalszym ciągu będzie występowała niespójność nagłówków, korygujemy kolejne strony, przykładowo usuwamy tabelę, która na pewno nie będzie stanowić nagłówka.

Po poprawieniu wszystkich niespójności powinniśmy otrzymać poniższy komunikat.

zrzut ekranu Norma EXPERT

Zakończenie importu

Klikamy na OK i kolejny raz na Podgląd.

zrzut ekranu Norma EXPERT

Otrzymujemy poniższy Podgląd

Jeżeli nie zamierzamy już nic poprawiać, zamykamy powyższe okno i wybieramy Importuj.

zrzut ekranu Norma EXPERT

Jeszcze tylko konwersja podstaw pozycji,

która ułatwi nam późniejsze przejście z przedmiaru na kosztorys.

zrzut ekranu Norma EXPERT

I gotowe.

zrzut ekranu Norma EXPERT

Czyżby... pozostaje jeszcze przekształcenie przedmiaru na kosztorys, sprawdzenie nakładów, wprowadzenie cen RMS i narzutów kosztorysowych, wydruk... jest co robić.

Warto podkreślić, że na przedmiarach i prostych strukturach import plików PDF się nie kończy. Użytkownik ma możliwość budowania własnych szablonów, czy to wykonanych metodą szczegółową kosztorysów ofertowych, czy inwestorskich, a także przedmiarów z wierszami obmiarowymi itd.