WO2026087091 - METHOD AND SYSTEM FOR ENHANCING PERFORMANCE OF LARGE LANGUAGE MODELS USING QUANTUM CIRCUITS

National phase entry is expected:
Publication Number WO/2026/087091
Publication Date 30.04.2026
International Application No. PCT/EP2025/073979
International Filing Date 22.08.2025
Title **
[English] METHOD AND SYSTEM FOR ENHANCING PERFORMANCE OF LARGE LANGUAGE MODELS USING QUANTUM CIRCUITS
[French] PROCÉDÉ ET SYSTÈME POUR AMÉLIORER LES PERFORMANCES DE GRANDS MODÈLES DE LANGAGE À L'AIDE DE CIRCUITS QUANTIQUES
Applicants **
MULTIVERSE COMPUTING S.L.
Inventors
AIZPURUA, Borja
SINGH, Sukhbinder
ORÚS, Román
Priority Data
PCT/IB2024/000540   22.10.2024   IB
24210818.1   05.11.2024   EP
18/944,603   12.11.2024   US
Application details
Total Number of Claims/PCT *
Number of Independent Claims *
Number of Priorities *
Number of Multi-Dependent Claims *
Number of Drawings *
Pages for Publication *
Number of Pages with Drawings *
Pages of Specification *
*
Number of Office Actions *
*
International Searching Authority
*
Recordal of a Change of the Applicant's Name/Address
*
Type of Assignment
*
Applicant's Legal Status
*
*
*
*
*
*
Entry into National Phase under
*
Patent Delivery
*
Translation

* The data is based on automatic recognition. Please verify and amend if necessary.

** IP-Coster compiles data from publicly available sources. If this data includes your personal information, you can contact us to request its removal.

Quotation for National Phase entry

Country StagesTotal
China Filing, Examination, Granting2194
EPO Filing, Examination, Granting8335
Japan Filing, Examination, Granting2181
South Korea Filing, Examination, Granting2084
USA Filing, Examination, Granting4740
MasterCard Visa
Total: 19,534
Contact Us
Abstract[English] The method enhances computational efficiency and performance of large language models (LLMs) through hybrid classical-quantum processing. The method involves a classical computer receiving an input for processing by a selected LLM comprising deep self-attention and multilayer perceptron layers and decomposing the LLM's weight matrices into a first Matrix Product Operator (MPO). The classical computer identifies one or more disentanglers which factorize the MPO into a non-unitary tensor network and a set of unitary subcomponents. The non-unitary tensor network enables compression by localizing quantum correlations. The unitary subcomponents correspond to first and second variational quantum circuits, configured to run sequentially on a quantum computer. The execution of the second quantum circuit is conditioned on both the measurements of the first quantum circuit and outputs from the tensor network, enabling enhanced correlation capture and efficient model representation.[French] Le procédé améliore l'efficacité de calcul et les performances de grands modèles de langage (LLM) par le biais d'un traitement quantique classique hybride. Le procédé implique un ordinateur conventionnel recevant une entrée pour un traitement par un modèle LLM sélectionné comprenant une auto-attention profonde et des couches de perceptron multicouche et décomposant les matrices de poids du modèle LLM en un premier opérateur de produit matriciel (MPO). L'ordinateur conventionnel identifie un ou plusieurs démêlants qui factorisent l’opérateur MPO en un réseau de tenseurs non unitaire et en un ensemble de sous-composants unitaires. Le réseau de tenseur non unitaire permet une compression par localisation de corrélations quantiques. Les sous-composants unitaires correspondent à des premier et second circuits quantiques variationnels, configurés pour fonctionner séquentiellement sur un ordinateur quantique. L'exécution du second circuit quantique est conditionnée à la fois aux mesures du premier circuit quantique et aux sorties provenant du réseau de tenseur, ce qui permet une capture de corrélation améliorée et une représentation de modèle efficace.

Rejoining the server...