Oznaczanie obiektów w dokumentach o układzie stałym za pomocą Deep Learning

  • projekt:
  • klient:
  • rok: 2018
  • website:

wyzwanie:

Dokumenty techniczne lub naukowe zwykle zawierają – oprócz tekstu – dużo danych, tabel lub diagramów. W jednym z naszych systemów kluczowe było wyodrębnienie tego rodzaju obiektów z dokumentu PDF jako osobnego obrazu i odnotowanie jego lokalizacji w oryginalnym dokumencie.

użyte narzędzia:

Keras
Tensorflow
Python
CNN
Flask
Wykorzystaliśmy techniki Deep Learning do identyfikacji interesujących nas obiektów.

rozwiązanie:

Wdrożyliśmy algorytm wykrywania YOLO i oceniliśmy wiele architektur leżących u podstaw konwulcyjnych sieci neuronowych.

W pierwszym etapie wytrenowaliśmy model na dużym zestawie oznakowanych obrazów, by następnie użyć Transfer Learning’u i dostosować model do naszego problemu

Aby zwiększyć zestaw danych dla naszego konkretnego zadania, zastosowaliśmy Data Augmentation.

skutek:

Korzystając z mechanizmu Deep Learning stworzyliśmy system, który może wykrywać i wyodrębniać obiekty z dokumentów o układzie stałym.