WO2023061465 - METHODS, SYSTEMS, AND MEDIA FOR COMPUTER VISION USING 2D CONVOLUTION OF 4D VIDEO DATA TENSORS

National phase entry:
Publication Number WO/2023/061465
Publication Date 20.04.2023
International Application No. PCT/CN2022/125299
International Filing Date 14.10.2022
Title **
[English] METHODS, SYSTEMS, AND MEDIA FOR COMPUTER VISION USING 2D CONVOLUTION OF 4D VIDEO DATA TENSORS
[French] PROCÉDÉS, SYSTÈMES ET SUPPORTS DE VISION ARTIFICIELLE UTILISANT UNE CONVOLUTION 2D DE TENSEURS DE DONNÉES VIDÉO 4D
Applicants **
HUAWEI TECHNOLOGIES CO., LTD. Huawei Administration Building, Bantian Longgang District Shenzhen, Guangdong 518129, CN
Inventors
HAJIMOLAHOSEINI, Habib 2103 Mayflower Blvd. Oakville, Ontario L6H 4E6, CA
KUMAR, Kaushal 370 Hwy 7 E Unit #719 Richmond Hill, Ontario L4B 0C4, CA
DENG, Gordon 167 Rue Du Ralon-Laveur Gatineau, Québec J9J 4C1, CA
Priority Data
17/502,588   15.10.2021   US
front page image
Application details
Total Number of Claims/PCT *
Number of Independent Claims *
Number of Priorities *
Number of Multi-Dependent Claims *
Number of Drawings *
Pages for Publication *
Number of Pages with Drawings *
Pages of Specification *
*
*
International Searching Authority
*
Applicant's Legal Status
*
*
*
*
*
Entry into National Phase under
*
Translation

Recalculate

* The data is based on automatic recognition. Please verify and amend if necessary.

** IP-Coster compiles data from publicly available sources. If this data includes your personal information, you can contact us to request its removal.

Quotation for National Phase entry

Country StagesTotal
China Filing1434
EPO Filing, Examination9258
Japan Filing591
South Korea Filing575
USA Filing, Examination3310
MasterCard Visa

Total: 15168

The term for entry into the National Phase has expired. This quotation is for informational purposes only

Abstract[English] Methods, systems and media for computer vision using 2D convolution of 4D video data tensors are described. 3D convolution operations performed on 5D input tensors are simulated by performing 2D convolution of 4D tensors instead. A convolution block of a CNN performs two parallel operations: a spatial processing branch performs spatial feature extraction on a 4D tensor using 2D convolution, whereas a temporal processing branch performs temporal feature extraction on a different 4D tensor using 2D convolution. The output tensors of the spatial processing branch and the temporal processing branch are combined to generate an output tensor of the convolution block. The convolution block may include additional operations such as reshaping and/or further convolution operations to generate identically-sized output tensors for each branch, thereby eliminating the need for post- processing of the branches' output tensors prior to combining them.[French] L'invention concerne des procédés, des systèmes et des supports de vision artificielle utilisant une convolution 2D de tenseurs de données vidéo 4D. Des opérations de convolution 3D effectuées sur des tenseurs d'entrée 5D sont simulées en réalisant à la place une convolution 2D de tenseurs 4D. Un bloc de convolution d'un CNN effectue deux opérations parallèles : une branche de traitement spatial réalise une extraction de caractéristiques spatiales sur un tenseur 4D au moyen d'une convolution 2D, tandis qu'une branche de traitement temporel effectue une extraction de caractéristiques temporelles sur un tenseur 4D différent au moyen d'une convolution 2D. Les tenseurs de sortie de la branche de traitement spatial et de la branche de traitement temporel sont combinés pour générer un tenseur de sortie du bloc de convolution. Le bloc de convolution peut comprendre des opérations supplémentaires telles qu'un remodelage et/ou d'autres opérations de convolution pour générer des tenseurs de sortie de taille identique pour chaque branche, ce qui permet d'éliminer la nécessité d'un post-traitement des tenseurs de sortie des branches avant de les combiner.
An unhandled error has occurred. Reload 🗙