WO2026087091 - METHOD AND SYSTEM FOR ENHANCING PERFORMANCE OF LARGE LANGUAGE MODELS USING QUANTUM CIRCUITS
National phase entry is expected:
Publication Number
WO/2026/087091
Publication Date
30.04.2026
International Application No.
PCT/EP2025/073979
International Filing Date
22.08.2025
Title **
[English]
METHOD AND SYSTEM FOR ENHANCING PERFORMANCE OF LARGE LANGUAGE MODELS USING QUANTUM CIRCUITS
[French]
PROCÉDÉ ET SYSTÈME POUR AMÉLIORER LES PERFORMANCES DE GRANDS MODÈLES DE LANGAGE À L'AIDE DE CIRCUITS QUANTIQUES
Applicants **
MULTIVERSE COMPUTING S.L.
Inventors
AIZPURUA, Borja
SINGH, Sukhbinder
ORÚS, Román
Priority Data
PCT/IB2024/000540
22.10.2024
IB
24210818.1
05.11.2024
EP
18/944,603
12.11.2024
US
Application details
| Total Number of Claims/PCT | * |
| Number of Independent Claims | * |
| Number of Priorities | * |
| Number of Multi-Dependent Claims | * |
| Number of Drawings | * |
| Pages for Publication | * |
| Number of Pages with Drawings | * |
| Pages of Specification | * |
| * | |
| Number of Office Actions | * |
| * | |
International Searching Authority |
EPO
* |
| Recordal of a Change of the Applicant's Name/Address |
Change of Applicant's Name and Address
* |
| Type of Assignment |
The Standard Agent's Assignment
* |
| Applicant's Legal Status |
Legal Entity
* |
| * | |
| * | |
| * | |
| * | |
| * | |
| Entry into National Phase under |
Chapter I
* |
| Patent Delivery |
Send the Letters Patent by Courier
* |
| Translation |
|
* The data is based on automatic recognition. Please verify and amend if necessary.
** IP-Coster compiles data from publicly available sources. If this data includes your personal information, you can contact us to request its removal.
Quotation for National Phase entry
| Country | Stages | Total | |
|---|---|---|---|
| China | Filing, Examination, Granting | 2206 | |
| EPO | Filing, Examination, Granting | 8479 | |
| Japan | Filing, Examination, Granting | 2199 | |
| South Korea | Filing, Examination, Granting | 2097 | |
| USA | Filing, Examination, Granting | 4740 |

Total:
19,721
Contact Us
Abstract[English]
The method enhances computational efficiency and performance of large language models (LLMs) through hybrid classical-quantum processing. The method involves a classical computer receiving an input for processing by a selected LLM comprising deep self-attention and multilayer perceptron layers and decomposing the LLM's weight matrices into a first Matrix Product Operator (MPO). The classical computer identifies one or more disentanglers which factorize the MPO into a non-unitary tensor network and a set of unitary subcomponents. The non-unitary tensor network enables compression by localizing quantum correlations. The unitary subcomponents correspond to first and second variational quantum circuits, configured to run sequentially on a quantum computer. The execution of the second quantum circuit is conditioned on both the measurements of the first quantum circuit and outputs from the tensor network, enabling enhanced correlation capture and efficient model representation.[French]
Le procédé améliore l'efficacité de calcul et les performances de grands modèles de langage (LLM) par le biais d'un traitement quantique classique hybride. Le procédé implique un ordinateur conventionnel recevant une entrée pour un traitement par un modèle LLM sélectionné comprenant une auto-attention profonde et des couches de perceptron multicouche et décomposant les matrices de poids du modèle LLM en un premier opérateur de produit matriciel (MPO). L'ordinateur conventionnel identifie un ou plusieurs démêlants qui factorisent l’opérateur MPO en un réseau de tenseurs non unitaire et en un ensemble de sous-composants unitaires. Le réseau de tenseur non unitaire permet une compression par localisation de corrélations quantiques. Les sous-composants unitaires correspondent à des premier et second circuits quantiques variationnels, configurés pour fonctionner séquentiellement sur un ordinateur quantique. L'exécution du second circuit quantique est conditionnée à la fois aux mesures du premier circuit quantique et aux sorties provenant du réseau de tenseur, ce qui permet une capture de corrélation améliorée et une représentation de modèle efficace.