WO2024261626 - VISUAL SPEECH RECOGNITION BASED COMMUNICATION TRAINING SYSTEM
National phase entry is expected:
Publication Number
WO/2024/261626
Publication Date
26.12.2024
International Application No.
PCT/IB2024/055908
International Filing Date
17.06.2024
Title **
[English]
VISUAL SPEECH RECOGNITION BASED COMMUNICATION TRAINING SYSTEM
[French]
SYSTÈME DE FORMATION À LA COMMUNICATION BASÉ SUR LA RECONNAISSANCE VOCALE VISUELLE
Applicants **
TECHNOLOGY INNOVATION INSTITUTE – SOLE PROPRIETORSHIP LLC
Accelerator Building 2
Southeast Sector 45-01
Khalifa City, Abu Dhabi, AE
Inventors
COJOCARU, Elena-Ruxandra
Accelerator Building 2
Southeast Sector 45-01
Khalifa City, Abu Dhabi, AE
WU, Kebin
Accelerator Building 2
Southeast Sector 45-01
Khalifa City, Abu Dhabi, AE
ALMAZROUEI, Ebtesam
Accelerator Building 2
Southeast Sector 45-01
Khalifa City, Abu Dhabi, AE
Priority Data
63/509,626
22.06.2023
US
Application details
| Total Number of Claims/PCT | * |
| Number of Independent Claims | * |
| Number of Priorities | * |
| Number of Multi-Dependent Claims | * |
| Number of Drawings | * |
| Pages for Publication | * |
| Number of Pages with Drawings | * |
| Pages of Specification | * |
| * | |
| * | |
International Searching Authority |
IP Australia
* |
| Applicant's Legal Status |
Legal Entity
* |
| * | |
| * | |
| * | |
| * | |
| Entry into National Phase under |
Chapter I
* |
| Translation |
|
Recalculate
* The data is based on automatic recognition. Please verify and amend if necessary.
** IP-Coster compiles data from publicly available sources. If this data includes your personal information, you can contact us to request its removal.
Quotation for National Phase entry
| Country | Stages | Total | |
|---|---|---|---|
| China | Filing | 1370 | |
| EPO | Filing, Examination | 9083 | |
| Japan | Filing | 533 | |
| South Korea | Filing | 575 | |
| USA | Filing, Examination | 3035 |

Total: 14596 USD
Abstract[English]
Systems, methods, and computer-readable media for implementing a teaching system focused on the topic of communication via lip-reading using AI-based (automated) visual speech recognition (e.g., VSR) technology, both for developing relevant lesson content and for evaluating user progress. More particularly, the present embodiments can implement AI-based automated lip- reading (also called visual speech recognition or VSR) algorithms in combination with other image processing and machine learning tools to create a teaching system for helping a user learn how to understand conversations through lip-reading and/or how to produce tailored or silent speech so as to be more easily understood through lip-reading.[French]
L'invention concerne des systèmes, des procédés et des supports lisibles par ordinateur destinés à mettre en œuvre un système d'enseignement axé sur le sujet de la communication par l'intermédiaire de la lecture sur les lèvres en utilisant une technologie de reconnaissance vocale visuelle (VSR, par exemple) basée sur l'IA (automatisée), à la fois pour développer du contenu de cours pertinent et pour évaluer la progression de l'utilisateur. Plus particulièrement, les présents modes de réalisation peuvent mettre en œuvre des algorithmes de lecture sur les lèvres (également appelée reconnaissance vocale visuelle ou VSR pour « visual speech recognition ») automatisés à base d'IA en combinaison avec d'autres outils de traitement d'image et d'apprentissage machine pour créer un système d'enseignement destiné à aider un utilisateur à apprendre comment comprendre des conversations en lisant sur les lèvres et/ou comment produire un discours personnalisé ou silencieux de façon à se faire comprendre plus facilement par la lecture sur les lèvres.