Este breve post tiene dos propósitos. El primero, presentar un problema fundamental en comunicación inalámbrica y el rol de la teoría de matrices aleatorias en su solución. El segundo, exponer algunas de las contribuciones por parte de la Red Mexicana de Matrices Aleatorias, Probabilidad No Conmutativa y Temas Afines. Para reducir la longitud de este post, procuramos exponer las ideas principales en su mínima expresión evitando detalles técnicos.
Modelo
Un sistema multiantena es un sistema de comunicación inalámbrica en el que el receptor y el transmisor utilizan múltiples antenas. Para simplificar la exposición, en este post supondremos que el receptor y el transmisor utilizan antenas cada uno.
Los sistemas de comunicación inalámbrica usualmente envían señales electromagnéticas sinusoidales, i.e., de la forma . En este contexto, la información es codificada a través de variaciones a la amplitud
y la fase
. Puesto que sólo estas dos cantidades son de interés en el proceso de comunicación, es natural representarlas a través de números complejos de la forma
.
Por lo tanto, abstractamente un sistema multiantena transmite un vector y recibe otro vector
. En principio, la relación entre
y
se puede obtener de una descripción detallada del sistema y el ambiente. Sin embargo, en situaciones prácticas es imposible encontrar esta relación y por lo tanto se adopta un modelo de naturaleza estocastica. Sin duda, el modelo más prominente es el llamado `modelo lineal’, en el cual
donde es una matriz (¡aleatoria!)
y
es un vector de variables aleatorias independientes idénticamente distribuidas (iid) con distribución Gaussiana compleja
. Además, este modelo supone que
,
y
son independientes. Bajo este modelo, el sistema multiantena queda entonces representado por la matriz aleatoria
. En lo sucesivo, siempre trabajaremos en el marco de este modelo. Las hipótesis técnicas detallas pueden ser vistas, por ejemplo, en el libro de A. Tulino y S. Verdú [S1, pág. 3].
Problema
Desde un punto de vista aplicado, es necesario saber de antemano cuál sera el desempeño de un sistema de comunicaciones dado. Esto permite, entre otras cosas, saber si la inversion en dicho sistema será rentable. Por lo tanto, tenemos el siguiente.
Problema. ¿Cuánta información puede pasar a través de un sistema de comunicaciones dado?
Para responder esta pregunta es necesario tener una definición precisa para la cantidad de información. Sin embargo, hay más de una definición dependiendo del tipo de aplicación que se tenga en mente. La noción más popular es sin duda la de capacidad ergódica. E. Telatar [S2] demostró que, bajo ciertos supuestos, la Capacidad Ergódica (por antena receptora) de un sistema multiantena iguala
donde el supremo es tomado sobre todas las matrices de covarianza con
,
es la esperanza con respecto a la distribución de
,
es la matrix identidad, y
denota la transpuesta conjugada de
. En algunas aplicaciones, e.g., cuando hay limitaciones tecnológicas en los dispositivos de comunicación, es de interés la llamada Información Mutua (por antena receptora), la cual está definida como
Nótese que , aunque en algunos casos especiales
. Dadas estas medidas para la cantidad de información, el problema en términos matemáticos es el siguiente.
Problema. Dada una matriz aleatoria , encontrar
o, en su defecto,
.
Encontrar y la matriz
que la alcanza es un problema retador. A través de los años se han encontrado fórmulas y métodos para realizar esta tarea en una variedad de casos especiales. Recientemente, M. Diaz [S3] demostró que muchos de estos resultados se pueden unificar utilizando la llamada medida de Haar. En particular, demostró que las simetrías de la distribución de
pueden ser utilizadas para obtener eficientemente
y por tanto
.
Un enfoque que ha probado ser fructífero para encontrar , y en algunas ocaciones especiales
, es el enfoque asintótico.
Enfoque Asintótico: Información Mutua
Sean los eigenvalores de
. Es posible reescribir
como
donde es la distribución de probabilidad determinada por
La distribución es conocida como la distribución empírica espectral promedio de
.
La teoría de matrices aleatorias ha demostrado que, bajo ciertas hipótesis, converge en distribución a una cierta
cuando
y, más aún, que
En particular, aproxima
con
suficientemente grande, i.e.,
es una respuesta aproximada para el Problema de la sección anterior. Por supuesto, si
entonces
es una aproximación para
. A continuación discutimos algunas situaciones particulares en las que este enfoque ha sido exitoso.
Modelo Gaussiano
Supóngase que es una matriz aleatoria tal que
son variables aleatorias iid Gaussianas complejas
. Bajo este supuesto, E. Telatar [S2] demostró que
i.e., que y
. En particular,
El Teorema de Marchenko-Pastur [M1] implica que converge en distribución a
, la llamada distribución de Marchenko-Pastur. Utilizando este hecho, E. Telatar encontró que
Por limitaciones de espacio no discutiremos las implicaciones prácticas de este resultado, nos conformaremos con decir que el hecho de que exista y sea un número positivo implica que, en teoría, un sistema multiantena puede transmitir grandes cantidades de información. Este hecho fue un avance decisivo en el desarrollo de los sistemas multiantena.
Modelos Algebraicos
Por supuesto, el modelo Gaussiano no le ajusta a todos los sistemas multiantena. Con el paso del tiempo diferentes modelos han sido analizados, véase, por ejemplo, el libro de R. Couillet y M. Debbah [S4]. Una forma muy flexible de crear modelos nuevos a partir de modelos conocidos es la siguiente.
Supóngase que son matrices aleatorias cuya distribución empírica espectral converge y
es un polinomio en
variables no conmutativas. Definimos entonces
Este tipo de modelo ajusta algunos sistemas multiantena para los cuales el modelo Gaussiano es inapropiado, e.g., sistemas con relevos. Por supuesto, para poder calcular es necesario saber si
converge en distribución cuando
y poder determinar su límite.
Bajo ciertas condiciones, las matrices se comportan asintóticamente como variables aleatorias libres en un cierto espacio de probabilidad no conmutativo. En particular, esto implica que
converge en distribución cuando
. S. Belinschi, T. Mai, R. Speicher, J. Treilhard y C. Vargas [P1,P2] demostraron que es posible calcular la distribución de la suma y el producto de variables aleatorias libres (con amalgamación) utilizando ecuaciones de punto fijo. Estos resultados, combinados con una técnica llamada linealización, permiten calcular el límite al cual converge la distribución empírica espectral de
. En particular, esto hace accesible el cálculo de
para la clase de modelos aquí discutida. Esta metodología es discutida por R. Speicher en [P3].
Enfoque Asintótico: Capacidad Ergódica
A diferencia de , el cálculo de
depende de una optimización sobre un conjunto que crece con
, i.e., el conjunto de matrices de covarianza de dimensión
. Si no se tiene una expresión exacta para
, como en el modelo Gaussiano, el enfoque asintótico es inaplicable.
Uno de los pocos casos conocidos donde esta dificultad ha sido resuelta es cuando la matrix es una matrix a bloques. Específicamente, cuando
donde son matrices aleatorias de dimensión
. En este modelo
permanece fija.
Bajo ciertas condiciones, M. Diaz y V. Pérez-Abreu [S5] demostraron que converge y su límite,
puede ser aproximado optimizando una cierta función (independiente de ) sobre las matrices de covarianza de dimensión
. Además, demostraron que la matriz que alcanza
puede ser utilizada para aproximar una matriz que alcanza
para
finita. El cálculo de
depende fuertemente en los resultados en [P1] y [P2].
Extensiones a Sistemas Multiusuarios
En este post nos enfocamos al caso de un solo transmisor y un solo receptor. Existen diversos métodos para estudiar situaciones en las que existen varios transmisores y/o receptores. Para los propósitos de este post es relevante señalar que, extendiendo resultados clásicos de matrices aleatorias a los llamados espacios rectangulares introducidos por Benaych-Georges [P4], R. Speicher y C. Vargas [P5] crearon herramientas basadas en probabilidad libre para estudiar el caso en el que hay un receptor y multiples transmisores. Esto dio origen a los llamados Equivalentes Deterministas Libre, la contraparte de los Equivalentes Deterministas introducidos por Girko [M2].
Referencias Bibliográficas
Las siguientes referencias, ordenadas por tema, distan de ser exhaustivas. Únicamente las referencias discutidas en este post, y algunas íntimamente relacionadas, son mencionadas.
Sistemas Multiantena
[S1] A. Tulino y S. Verdú. Random Matrix Theory and Wireless Communications. Foundations and trends in communications and information theory, 2004.
[S2] E. Telatar. “Capacity of multi-antenna Gaussian channels.” European Transactions on Telecommunications, 1999.
[S3] M. Diaz. “On the symmetries and the capacity achieving input covariance matrices of multiantenna channels.” International Symposium on Information Theory, 2016.
[S4] R. Couillet y M. Debbah. Random Matrix Methods for Wireless Communications. Cambridge University Press, 2011.
[S5] M. Diaz y V. Pérez-Abreu. “On the capacity of block multiantenna channels.” IEEE Transactions on Information Theory, 2017.
Matrices Aleatorias
[M1] V. Marchenko y L. Pastur. “Distribution of eigenvalues for some sets of random matrices.” Mat. Sb. (N.S.), 1967.
[M2] V. Girko. Theory of Stochastic Canonical Equations. Vol. I. Kluwer Academic Publishers, 2001.
Probabilidad Libre
[P1] S. Belinschi, R. Speicher, J. Treilhard y C. Vargas. “Operator-valued free multiplicative convolution: analytic subordination theory and applications to random matrix theory.” International Mathematics Research Notices, 2015.
[P2] S. Belinschi, T. Mai y R. Speicher. “Analytic subordination theory of operator-valued free additive convolution and the solution of a general random matrix problem.” Journal für die Reine und Angewandte Mathematik, 2015.
[P3] R. Speicher. “Polynomials in asymptotically free random matrices.” Acta Physica Polonica B, 2015.
[P4] F. Benaych-Georges. “Rectangular random matrices, entropy, and Fisher’s information.” Journal of Operator Theory, 2009.
[P5] R. Speicher y C. Vargas. “Free deterministic equivalents, rectangular random matrix models, and operator-valued free probability theory.” Random Matrices Theory Appl., 2012.