Un Problema de Comunicación Inalámbrica y Algunas Contribuciones por Parte de la Red Mexicana de Matrices Aleatorias, Probabilidad No Conmutativa y Temas Afines

Este breve post tiene dos propósitos. El primero, presentar un problema fundamental en comunicación inalámbrica y el rol de la teoría de matrices aleatorias en su solución. El segundo, exponer algunas de las contribuciones por parte de la Red Mexicana de Matrices Aleatorias, Probabilidad No Conmutativa y Temas Afines. Para reducir la longitud de este post, procuramos exponer las ideas principales en su mínima expresión evitando detalles técnicos.

Modelo

Un sistema multiantena es un sistema de comunicación inalámbrica en el que el receptor y el transmisor utilizan múltiples antenas. Para simplificar la exposición, en este post supondremos que el receptor y el transmisor utilizan N antenas cada uno.

Los sistemas de comunicación inalámbrica usualmente envían señales electromagnéticas sinusoidales, i.e., de la forma x(t)=A\sin(\omega t+\theta). En este contexto, la información es codificada a través de variaciones a la amplitud A y la fase \theta. Puesto que sólo estas dos cantidades son de interés en el proceso de comunicación, es natural representarlas a través de números complejos de la forma Ae^{i \theta}.

Por lo tanto, abstractamente un sistema multiantena transmite un vector x \in \mathbb{C}^N y recibe otro vector y \in \mathbb{C}^N. En principio, la relación entre x y y se puede obtener de una descripción detallada del sistema y el ambiente. Sin embargo, en situaciones prácticas es imposible encontrar esta relación y por lo tanto se adopta un modelo de naturaleza estocastica. Sin duda, el modelo más prominente es el llamado `modelo lineal’, en el cual

\displaystyle y = H_N x + n,

donde H_N es una matriz (¡aleatoria!) N\times N y n es un vector de variables aleatorias independientes idénticamente distribuidas (iid) con distribución Gaussiana compleja \mathcal{N}(0,1). Además, este modelo supone que x, H_N y n son independientes. Bajo este modelo, el sistema multiantena queda entonces representado por la matriz aleatoria H_N. En lo sucesivo, siempre trabajaremos en el marco de este modelo. Las hipótesis técnicas detallas pueden ser vistas, por ejemplo, en el libro de A. Tulino y S. Verdú [S1, pág. 3].

Problema

Desde un punto de vista aplicado, es necesario saber de antemano cuál sera el desempeño de un sistema de comunicaciones dado. Esto permite, entre otras cosas, saber si la inversion en dicho sistema será rentable. Por lo tanto, tenemos el siguiente.

Problema. ¿Cuánta información puede pasar a través de un sistema de comunicaciones dado?

Para responder esta pregunta es necesario tener una definición precisa para la cantidad de información. Sin embargo, hay más de una definición dependiendo del tipo de aplicación que se tenga en mente. La noción más popular es sin duda la de capacidad ergódica. E. Telatar [S2] demostró que, bajo ciertos supuestos, la Capacidad Ergódica (por antena receptora) de un sistema multiantena iguala

\displaystyle C_N := \max_Q \frac{1}{N} \mathbb{E}(\log\det({\rm I}_N + H_NQH_N^*)),

donde el supremo es tomado sobre todas las matrices de covarianza Q con \sum_{i=1}^N Q(i,i)=1, \mathbb{E} es la esperanza con respecto a la distribución de H_N, {\rm I}_N es la matrix identidad, y M^* denota la transpuesta conjugada de M. En algunas aplicaciones, e.g., cuando hay limitaciones tecnológicas en los dispositivos de comunicación, es de interés la llamada Información Mutua (por antena receptora), la cual está definida como

\displaystyle I_N = \frac{1}{N} \mathbb{E}(\log\det({\rm I}_N+N^{-1}H_NH_N^*)).

Nótese que I_N \leq C_N, aunque en algunos casos especiales I_N=C_N. Dadas estas medidas para la cantidad de información, el problema en términos matemáticos es el siguiente.

Problema. Dada una matriz aleatoria H_N, encontrar C_N o, en su defecto, I_N.

Encontrar C_N y la matriz Q_0 que la alcanza es un problema retador. A través de los años se han encontrado fórmulas y métodos para realizar esta tarea en una variedad de casos especiales. Recientemente, M. Diaz [S3] demostró que muchos de estos resultados se pueden unificar utilizando la llamada medida de Haar. En particular, demostró que las simetrías de la distribución de H_N pueden ser utilizadas para obtener eficientemente Q_0 y por tanto C_N.

Un enfoque que ha probado ser fructífero para encontrar I_N, y en algunas ocaciones especiales C_N, es el enfoque asintótico.

Enfoque Asintótico: Información Mutua

Sean \lambda_1\leq \cdots \leq \lambda_N los eigenvalores de \displaystyle \frac{H_NH_N^*}{N}. Es posible reescribir I_N como

\displaystyle I_N = \int_0^\infty \log(1+x) \,\textrm{d} F_N(x),

donde F_N es la distribución de probabilidad determinada por

\displaystyle F_N(x) = \mathbb{E} \frac{1}{N} \sum_{k=1}^N 1_{\lambda_k\leq x}.

La distribución F_N es conocida como la distribución empírica espectral promedio de \displaystyle \frac{H_NH_N^*}{N}.

La teoría de matrices aleatorias ha demostrado que, bajo ciertas hipótesis, F_N converge en distribución a una cierta F cuando N\to\infty y, más aún, que

\displaystyle \lim_{N\to\infty} I_N = \int_0^\infty \log(1+x) \,\textrm{d} F(x) =: I_\infty.

En particular, I_\infty aproxima I_N con N suficientemente grande, i.e., I_\infty es una respuesta aproximada para el Problema de la sección anterior. Por supuesto, si I_N=C_N entonces I_\infty es una aproximación para C_N. A continuación discutimos algunas situaciones particulares en las que este enfoque ha sido exitoso.

Modelo Gaussiano

Supóngase que H_N es una matriz aleatoria tal que \{H_N(i,j):i,j=1,\ldots,N\} son variables aleatorias iid Gaussianas complejas \mathcal{N}(0,1). Bajo este supuesto, E. Telatar [S2] demostró que

\displaystyle C_N = \frac{1}{N} \mathbb{E}(\log\det({\rm I}_N+N^{-1}H_NH_N^*)),

i.e., que C_N=I_N y Q_0={\rm I}_N. En particular,

\displaystyle C_\infty := \lim_{N\to\infty} C_N = \lim_{N\to\infty} I_N = I_\infty.

El Teorema de Marchenko-Pastur [M1] implica que F_N converge en distribución a F_\textnormal{MP}, la llamada distribución de Marchenko-Pastur. Utilizando este hecho, E. Telatar encontró que

\displaystyle C_\infty = \int_0^\infty \log(1+x) \,\textrm{d} F_\textnormal{MP}(x) = \frac{\sqrt{5}-3}{2}+2\tanh^{-1}\frac{1}{\sqrt{5}} \approx 0.58.

Por limitaciones de espacio no discutiremos las implicaciones prácticas de este resultado, nos conformaremos con decir que el hecho de que C_\infty exista y sea un número positivo implica que, en teoría, un sistema multiantena puede transmitir grandes cantidades de información. Este hecho fue un avance decisivo en el desarrollo de los sistemas multiantena.

Modelos Algebraicos

Por supuesto, el modelo Gaussiano no le ajusta a todos los sistemas multiantena. Con el paso del tiempo diferentes modelos han sido analizados, véase, por ejemplo, el libro de R. Couillet y M. Debbah [S4]. Una forma muy flexible de crear modelos nuevos a partir de modelos conocidos es la siguiente.

Supóngase que \{X_{1,N},\ldots,X_{s,N}\} son matrices aleatorias cuya distribución empírica espectral converge y p es un polinomio en s variables no conmutativas. Definimos entonces

\displaystyle H_N = p(X_{1,N},\ldots,X_{s,N}).

Este tipo de modelo ajusta algunos sistemas multiantena para los cuales el modelo Gaussiano es inapropiado, e.g., sistemas con relevos. Por supuesto, para poder calcular I_\infty es necesario saber si F_N converge en distribución cuando N\to\infty y poder determinar su límite.

Bajo ciertas condiciones, las matrices \{X_{1,N},\ldots,X_{s,N}\} se comportan asintóticamente como variables aleatorias libres en un cierto espacio de probabilidad no conmutativo. En particular, esto implica que F_N converge en distribución cuando N\to\infty. S. Belinschi, T. Mai, R. Speicher, J. Treilhard y C. Vargas [P1,P2] demostraron que es posible calcular la distribución de la suma y el producto de variables aleatorias libres (con amalgamación) utilizando ecuaciones de punto fijo. Estos resultados, combinados con una técnica llamada linealización, permiten calcular el límite al cual converge la distribución empírica espectral de H_N. En particular, esto hace accesible el cálculo de I_\infty para la clase de modelos aquí discutida. Esta metodología es discutida por R. Speicher en [P3].

Enfoque Asintótico: Capacidad Ergódica

A diferencia de I_N, el cálculo de C_N depende de una optimización sobre un conjunto que crece con N, i.e., el conjunto de matrices de covarianza de dimensión N \times N. Si no se tiene una expresión exacta para C_N, como en el modelo Gaussiano, el enfoque asintótico es inaplicable.

Uno de los pocos casos conocidos donde esta dificultad ha sido resuelta es cuando la matrix H_N es una matrix a bloques. Específicamente, cuando

\displaystyle H_N = \begin{bmatrix} H^{(1,1)}_N & \cdots & H^{(1,d)}_N \\ \vdots & \ddots & \vdots\\ H^{(d,1)}_N & \cdots & H^{(d,d)}_N\end{bmatrix},

donde \{H^{(i,j)}_N:i,j=1,\ldots,d\} son matrices aleatorias de dimensión N\times N. En este modelo d permanece fija.

Bajo ciertas condiciones, M. Diaz y V. Pérez-Abreu [S5] demostraron que C_N converge y su límite,

\displaystyle C_\infty :=\lim_{N\to\infty} C_N,

puede ser aproximado optimizando una cierta función (independiente de N) sobre las matrices de covarianza de dimensión d \times d. Además, demostraron que la matriz que alcanza C_\infty puede ser utilizada para aproximar una matriz que alcanza C_N para N finita. El cálculo de C_\infty depende fuertemente en los resultados en [P1] y [P2].

Extensiones a Sistemas Multiusuarios

En este post nos enfocamos al caso de un solo transmisor y un solo receptor. Existen diversos métodos para estudiar situaciones en las que existen varios transmisores y/o receptores. Para los propósitos de este post es relevante señalar que, extendiendo resultados clásicos de matrices aleatorias a los llamados espacios rectangulares introducidos por Benaych-Georges [P4], R. Speicher y C. Vargas [P5] crearon herramientas basadas en probabilidad libre para estudiar el caso en el que hay un receptor y multiples transmisores. Esto dio origen a los llamados Equivalentes Deterministas Libre, la contraparte de los Equivalentes Deterministas introducidos por Girko [M2].

Referencias Bibliográficas

Las siguientes referencias, ordenadas por tema, distan de ser exhaustivas. Únicamente las referencias discutidas en este post, y algunas íntimamente relacionadas, son mencionadas.

Sistemas Multiantena

[S1] A. Tulino y S. Verdú. Random Matrix Theory and Wireless Communications. Foundations and trends in communications and information theory, 2004.

[S2] E. Telatar. “Capacity of multi-antenna Gaussian channels.” European Transactions on Telecommunications, 1999.

[S3] M. Diaz. “On the symmetries and the capacity achieving input covariance matrices of multiantenna channels.” International Symposium on Information Theory, 2016.

[S4] R. Couillet y M. Debbah. Random Matrix Methods for Wireless Communications. Cambridge University Press, 2011.

[S5] M. Diaz y V. Pérez-Abreu. “On the capacity of block multiantenna channels.” IEEE Transactions on Information Theory, 2017.

Matrices Aleatorias

[M1] V. Marchenko y L. Pastur. “Distribution of eigenvalues for some sets of random matrices.” Mat. Sb. (N.S.), 1967.

[M2] V. Girko. Theory of Stochastic Canonical Equations. Vol. I. Kluwer Academic Publishers, 2001.

Probabilidad Libre

[P1] S. Belinschi, R. Speicher, J. Treilhard y C. Vargas. “Operator-valued free multiplicative convolution: analytic subordination theory and applications to random matrix theory.” International Mathematics Research Notices, 2015.

[P2] S. Belinschi, T. Mai y R. Speicher. “Analytic subordination theory of operator-valued free additive convolution and the solution of a general random matrix problem.” Journal für die Reine und Angewandte Mathematik, 2015.

[P3] R. Speicher. “Polynomials in asymptotically free random matrices.” Acta Physica Polonica B, 2015.

[P4] F. Benaych-Georges. “Rectangular random matrices, entropy, and Fisher’s information.” Journal of Operator Theory, 2009.

[P5] R. Speicher y C. Vargas. “Free deterministic equivalents, rectangular random matrix models, and operator-valued free probability theory.” Random Matrices Theory Appl., 2012.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s