WO2023089384 - EXTRACTION OF BORDERLESS STRUCTURE FROM A DOCUMENT USING IMAGE PROCESSING
National phase entry:
Publication Number
WO/2023/089384
Publication Date
25.05.2023
International Application No.
PCT/IB2022/057153
International Filing Date
02.08.2022
Title **
[English]
EXTRACTION OF BORDERLESS STRUCTURE FROM A DOCUMENT USING IMAGE PROCESSING
[French]
EXTRACTION DE STRUCTURE SANS BORDURE À PARTIR D'UN DOCUMENT À L'AIDE D'UN TRAITEMENT D'IMAGE
Applicants **
L&T TECHNOLOGY SERVICES LIMITED
DLF IT SEZ Park, 2nd Floor – Block 3, 1/124, Mount Poonamallee Road, Ramapuram, Chennai - 600 089, Tamil Nadu, IN
Inventors
DAS, Tarun Kumar
449, Lachit Nagar, Digboi, Assam 786171, IN
MALLICK, Triptesh
N0026, Vill- Fulhari, Post-Pukhuria, Bankura, West Bengal 722160, IN
BALARAMAN, Mridul
B 206, SVS Palms 2, Chinnapanhalli Main Road,, Dodanekundi, Bangalore, Karnataka 560037, IN
SINGH, Madhusudan
B-603, Ajmera Stone Park, 1st Cross, Electronic City - 1, Bangalore, Karnataka 560100, IN
Priority Data
202141053505
22.11.2021
IN
Application details
| Total Number of Claims/PCT | * |
| Number of Independent Claims | * |
| Number of Priorities | * |
| Number of Multi-Dependent Claims | * |
| Number of Drawings | * |
| Pages for Publication | * |
| Number of Pages with Drawings | * |
| Pages of Specification | * |
| * | |
| * | |
International Searching Authority |
IP India
* |
| Applicant's Legal Status |
Legal Entity
* |
| * | |
| * | |
| * | |
| * | |
| Entry into National Phase under |
Chapter I
* |
| Translation |
|
Recalculate
* The data is based on automatic recognition. Please verify and amend if necessary.
** IP-Coster compiles data from publicly available sources. If this data includes your personal information, you can contact us to request its removal.
Quotation for National Phase entry
| Country | Stages | Total | |
|---|---|---|---|
| China | Filing | 961 | |
| EPO | Filing, Examination | 6426 | |
| Japan | Filing | 595 | |
| South Korea | Filing | 575 | |
| USA | Filing, Examination | 2710 |

Total: 11267 USD
The term for entry into the National Phase has expired. This quotation is for informational purposes only
Abstract[English]
A method and system of extracting borderless structure using image processing is disclosed. The method may include converting a received document into a binary image comprising a plurality of text characters. A first image is created comprising a plurality of text blobs by connecting text characters, and merging the plurality of text blobs to create one or more text line blobs to generate a second image. Further the first image and the second image are compared to generate a third image comprising a plurality of gap blobs. The gap blobs are clustered into one or more groups to determine a localized region of interest (ROI). Further lines are identified within the ROI using pixel density and separated into rows and columns. The final output contains list of cell coordinates.[French]
Sont divulgués un procédé et un système d'extraction de structure sans bordure à l'aide d'un traitement d'image. Le procédé peut comprendre la conversion d'un document reçu en une image binaire comprenant une pluralité de caractères de texte. Une première image comprenant une pluralité de blocs de texte est créée, en reliant des caractères de texte, et en fusionnant la pluralité de blocs de texte pour créer un ou plusieurs blocs de lignes de texte pour générer une deuxième image. En outre, la première image et la deuxième image sont comparées pour générer une troisième image comprenant une pluralité de blocs d'espace. Les blocs d'espace sont regroupés en un ou plusieurs groupes pour déterminer une région d'intérêt (ROI) localisée. D'autres lignes sont identifiées au sein de la ROI à l'aide de la densité de pixels et séparées en rangées et en colonnes. La sortie finale contient une liste de coordonnées de cellules.