Zastosowanie data capture w praktyce. Gdzie przydaje się automatyczna ekstrakcja danych?

Opublikowany: 3 lata temu

Kamil Siwecki

Kategoria: Blog, Rozwiązania informatyczne

Zastosowanie data capture w praktyce. Gdzie przydaje się automatyczna ekstrakcja danych? | Blog Archman

Podczas pracy biurowej, bardzo często potrzebne jest przepisanie danych z dokumentu do formularza elektronicznego. Może to być np. informacja o kontrahencie, zakupie i rachunku bankowym z faktury, elementy zamówienia czy też informacje o kandydacie do pracy pochodzące z otrzymanego CV. Każdorazowe przepisywanie danych to czynność męcząca i nużąca. Znakomitym pomysłem będzie więc zlecenie tej pracy maszynom.

Spis treści

Możliwości, jakie daje technologia data capture

Data capture to bardzo szerokie pojęcie, oznacza w dosłownym tłumaczeniu „przechwytywanie danych”. Może to być zarówno rozpoznawanie obiektów czy kształtów na obrazie, konkretnych schematów zapisu informacji lub wyrażeń kluczowych. Jest swojego rodzaju ‘oczami’ programu komputerowego, które starają się odwzorować sposób, w jaki człowiek, patrząc na zdjęcie lub dokument – poszukuje na nim informacji. Może więc ta technologia wspomóc nas zarówno w rozwoju systemów rozpoznawania twarzy, linii papilarnych czy też programów kierującymi pojazdami autonomicznymi; jak i w ekstrakcji danych tekstowych czy tabelarycznych.

Na ile sprawnie działa technologia data capture

Efektywność działania data capture to wartość dość trudna do zmierzenia w ujęciu ogólnym, gdyż do różnego typu rozpoznawanych danych przyjmuje się różne miary – i przede wszystkim – oczekuje się różnej efektywności. Systemy zabezpieczeń, takie jak czytniki linii papilarnych czy algorytmy rozpoznające twarz – muszą mieć praktycznie 100 % skuteczność. Systemy rozpoznawania znaków drogowych, pasów ruchu czy sygnalizacji świetlnej – tutaj również wymagana jest niezwykła dokładność. Natomiast np. w przypadku przepisywania niektórych danych z dokumentu, który będzie następnie zatwierdzany przez pracownika biurowego – akceptowalne są drobne literówki (często nie mające nic wspólnego z samym data capture, a z jakością mechanizmu OCR).

Częstą praktyką jest też niezwracanie zbyt mało prawdopodobnych danych i informowanie użytkownika o potrzebie uzupełnienia treści. Na podstawie takiej akcji ze strony człowieka wysokiej jakości systemy, takie jak moduł AI w NAVIGATORZE – douczą się i przy kolejnych dokumentach postąpią prawidłowo, korzystając z ‘wiedzy’ zdobytej dzięki obserwacji działania użytkownika. Najlepsze systemy data capture do obsługi dokumentów posiadają skuteczność ponad 85-90 %. Wyposażone są również w walidację danych szczególnie istotnych, takich jak numery kont bankowych, numery PESEL czy VAT, co powoduje znaczącą różnicę i wzrost dokładności w stosunku do samodzielnego uzupełniania przez użytkownika.

W jakich obszarach stosuje się obecnie data capture?

Wszystkie możliwości wykorzystania technologii ekstrakcji danych są praktycznie niepoliczalne. Ta technologia może być stosowana w branży przemysłowej (usprawnianie, analiza i monitorowanie pracy maszyn), automotive (autonomiczne pojazdy, systemy wspomagania kierowcy, rejestratory), a także w technologiach zabezpieczeń (rozpoznawanie twarzy, linii papilarnych, siatkówki etc.), medycynie (diagnozowanie schorzeń, np. zmian nowotworowych), czy po prostu w automatyzacji pracy biurowej (przepisywanie danych z dokumentów i ich walidacja). Z całą pewnością jest jeszcze wiele niezagospodarowanych obszarów, dla których wsparciem dla człowieka może być data capture.

Perspektywy rozwoju technologii data capture

Technologia data capture z całą pewnością na dobre zagości w wielu dziedzinach naszego życia – i z tego powinniśmy się cieszyć, bo sprawi ona, że codzienność będzie dużo prostsza, bezpieczniejsza i pozbawiona niepotrzebnych prac. Z czasem będzie też wzrastać efektywność tej technologii – nie tylko gromadzone są coraz większe zbiory danych, ale też istniejące modele douczają się dzięki interakcjom z użytkownikami. Na uczelniach wciąż prowadzone są badania nad nowymi algorytmami, a sektor przedsiębiorstw także nie zostaje w tyle – nie tylko implementuje akademickie rozwiązania, ale nieustannie poszukuje nowych scenariuszy użycia algorytmów sztucznej inteligencji.

Wystarczy wspomnieć o największych graczach, takich jak Amazon czy Google. Ci giganci wciąż dodają nowe usługi z obszaru data capture do swojego portfolio. Jednak wielu przedsiębiorców mogą odstraszać ceny tych usług, jak i brak ich dopasowania do europejskich realiów. Minusem jest także dość długi czas działania oraz konieczność wysyłania danych przez sieć. Na szczęście dobre rozwiązania przychodzą z Polski. Idealnym dowodem na prawdziwość tego zdania jest moduł Artificial Intelligence – szybkie, w pełni dostosowane do obsługi polskich dokumentów księgowych i dostępne on-premises.

Oceń artykuł

Kamil Siwecki

+ posts

Data Scientist w zespole WeDeliverAI (Archman), pasjonat matematyki, statystyki i nowych technologii. Ukończył Akademię Górniczo-Hutniczą w Krakowie na kierunku Informatyka i Ekonometria; absolwent modułu Machine Learning w Szkole Programowania WSEI. W codziennej pracy przygotowuje algorytmy oparte o uczenie maszynowe, wykorzystywane w systemie NAVIGATOR - rozwiązując problemy związane z automatyzacją procesów.