PACS: 04.20.-q; 02.40.Hw
1. Introducción
La esencia de la Relatividad General de Einstein radica en tratar a los fenómenos gravitacionales como una consecuencia de la geometría del espaciotiempo. En esta teoría, que consideramos la mejor descripción de la gravitación a la fecha, la materia y energía provocan que el espaciotiempo (2). se curve y a su vez, la materia en movimiento está obligada a seguir las trayectorias geodésicas del espaciotiempo mismo. Una geodésica se puede describir como una curva cuya tangente se transporta paralelamente a lo largo de si misma (3), pero para que el contenido de la frase anterior sea claro, es necesario entender en que consiste el transporte paralelo de vectores en un espaciotiempo curvo.
Transportar un vector conlleva a comparar vectores en puntos distintos del espaciotiempo, tarea que parecería ser sencilla si el espaciotiempo es plano, pero si el espaciotiempo es curvo, esta comparación requiere de alguna prescripción sobre como se modifican los vectores conforme nos desplazamos. Esta prescripción esta codificada en el objeto que llamamos conexión (4). En particular, la conexión que es relevante en Relatividad General es la conexión métrica, que garantiza que el valor del producto interno, dictado por la métrica del espaciotiempo, entre dos vectores cualesquiera, no se modifique al trasportarlos usando esta conexión (2).
Como vemos de los párrafos anteriores, la importancia de la conexión en el contexto de la Relatividad General es muy grande. Así mismo, un principio fundamental de la teoría es que su formulación sea independiente de las coordenadas que arbitrariamente elijamos para describirla, por lo que es muy importante conocer la forma en que los distintos objetos de relevancia para la teoría transforman ante un cambio de este tipo.
En este artículo estudiamos las propiedades que tienen los símbolos de Christoffel ante transformaciones de coordenadas a través de estudiar si son de carácter tensorial o no. El lector se dará cuenta a lo largo del presente escrito de que el análisis que se propone en la frase anterior es más sutil de lo que se pensaría a partir de una simple inspección de la expresión coordenada de los símbolos de Christoffel en términos de la métrica.
2. Tensores
Iniciemos nuestra discusión recordando al lector la definición de tensor, seguido por una pequeña serie de comentarios sobre ella para ganar familiaridad con este tipo de objetos matemáticos y en particular con la forma operacional en que serán utilizados en este trabajo. Para el beneficio del lector que así lo requiera, pero para no disminuir la continuidad del argumento, se han incluido un número de apéndices con recordatorios sobre algunos temas necesarios de álgebra lineal y geometría diferencial, dejando en el texto principal solamente los puntos clave para la exposición.
Un tensor T de rango (m, n) es un operador multilineal que actúa sobre m co-vectores, o vectores duales, y n vectores, resultando en un número real (5), es decir,
donde V, que se repite n veces, es un espacio vectorial y V*, que se repite m veces, es el espacio dual al V.
El que este mapeo sea multilineal quiere decir que cumple con las siguiente propiedades. Si cualquiera de los vectores o co-vectores sobre los que actúa se escribe como una suma de dos vectores o co-vectores, el resultado de la acción de T sobre este nuevo conjunto será la suma de las acciones sobre los conjuntos que tengan a cada vector o co-vector entre ellos, es decir, que la igualdad
se cumple independientemente de la entrada en que se reemplace el elemento por una suma. La otra propiedad a cumplir es que si cualquiera de los vectores o co-vectores sobre los que actúa se reemplaza por un múltiplo de si mismo, el resultado de la acción de T sobre este nuevo conjunto será el mismo múltiplo de veces el resultado de actuar con T sobre el conjunto original de vectores y co-vectores, es decir, que la igualdad
se cumple independientemente de la entrada en que se multiplique por la constante α.
La noción de que un tensor es un objeto parecido a una matriz, pero probablemente con más índices, tiene que ver con que una matriz M puede tomar un vector renglón V1 y un vector columna V2T, que en este caso toma el lugar de un co-vector, y mandarlos multilinealmente a un real por medio de la operación matricial V1MV2T, Es en este sentido que una matriz puede actuar como un tensor de rango (1,1).
De particular importancia para la discusión central de este artículo es que de la definición de tensor vista arriba se sigue que un mapeo lineal 𝒯 de V al espacio T(m,n) de tensores de rango (m, n).
es un tensor de rango (n, m + 1).
Para ver que la aseveración del párrafo anterior es cierta, basta con notar que tras haber actuado linealmente sobre un elemento de V, es decir, sobre un vector υ, 𝒯(υ) es un mapeo multilineal capaz de actuar sobre m co-vectores y n vectores. De lo anterior sigue que 𝒯 es en sí un mapeo que actúa multilinealmente sobre m co-vectores y n + 1 vectores en total para arrojar un número real, satisfaciendo en consecuencia la definición misma de un tensor de rango (n, m + 1).
De la misma forma, un mapeo multilineal
donde V* se repite M veces y V se repite N, es un tensor de rango (M + m, N + n).
Respecto a la forma de escribir a un tensor, recordando que un vector υ de un espacio V provee un mapeo lineal del espacio dual V* a los realesi, nos damos cuenta de que el espacio T(m,n) de tensores de rango (m, n) es el producto tensorial de m veces V y n veces V*, de tal forma que un tensor de rango (m, n) se puede escribir usando la base de vectores ei y su base dual ej como
donde cada uno de los multiíndices ia, jb toman valores
entre 1 y D, con D la dimensionalidad de
V, que es la misma que la de V*. La forma de
entender (6) es notando que cada uno de los vectores
No es difícil ver que en la suma involucrada en (6) hay
Dm+n elementos
El resultado de la acción de un tensor de rango (m, n) sobre
m co-vectores y n vectores dados debe de ser
independiente de la base ei (y el dual
ej) que se elija para representar a estos
objetos. Esta observación implica que si hay dos bases distintas de vectores
ei y
pues solo así el resultado de la acción de T sobre los vectores y co-vectores
escritos en términos de la base e será igual al resultado de
Queda claro entonces que un objeto cuyas componentes transformen de forma distinta a (7) no puede ser un tensor.
3. Tensores en Relatividad General
Hasta el momento hemos hablado sólo de vectores, co-vectores y tensores construidos sobre un espacio V y su dual, pero, dado que estamos interesados en el formalismo de la relatividad general, debemos recordar que en ella los vectores existen en los espacios tangentes al espacio-tiempo en cada punto p de este (6). Dicho de otra forma, cada punto p tiene asociado un espacio vectorial V dado por el espacio tangente en ese punto. Cada uno de estos espacios vectoriales se puede usar para construir el espacio dual V* y con ello, los espacios tensoriales de cualquier rango.
Llamemos entonces υp a los elementos del espacio tangente en el punto p, y υp a los elementos del espacio vectorial dual a este, llamado también espacio cotangente. El objeto que asocia un vector υp a cada punto p le llamamos campo vectorialii, y por simplicidad lo denotaremos υ. De igual forma podemos construir campos de vectores duales u que asocian un υp a cada punto p, y a estos campos los llamaremos 1-formas. Continuando en esta dirección, un campo tensorial debe de asociar un tensor a cada punto del espacio-tiempo, pero un tensor está definido por el mapeo multilineal discutido en la sección anterior, así que un campo tensorial T de rango (n, m) debe ser un objeto que actúa multilinealmente sobre n 1-formas y m campos vectoriales.
El resultado de actuar con una 1-forma u sobre un campo vectorial υ es fácil de visualizar, pues el co-vector asociado a cada punto υp debe actuar sobre el vector asociado al mismo punto υp y arrojar un número real. Un objeto que asocia un número real a cada punto del espacio es una función real, así que una 1-forma actúa sobre un campo vectorial y resulta en una función real. Para respetar la linealidad de la acción en cada punto que debe cumplir cualquier co-vector al operar sobre un vector, es necesario que las relaciones
se satisfagan para cualesquiera vectores υ, υ1, υ2 y función f arbitrarios.
De la misma forma, la acción de un campo tensorial T sobre las 1-formas y los campos vectoriales correspondiente a su rango debe ser una función real. Para implementar la multilinealidad de T en este contexto, notamos que (2) y (3) se deben cumplir en todo punto p del espacio-tiempo, y considerando que una función real f asocia un número real α a cada p, no es difícil convencerse de que las relaciones de multilinealidad que se deben cumplir para un campo tensorial son una idéntica a (2) con 1-formas y campos vectoriales y otra dada por
Vemos entonces que (10) se reduce a (3) al ser evaluada en un punto particular p, pues f(p) = α, pero aún más importante es que α está determinado exclusivamente por el valor de f en el punto p, y para este valor es irrelevante el comportamiento de f en una vecindad de p. Nos referimos a este comportamiento como que T es multilineal sobre el espacio de las funciones.
4. Conexiones
Una conexión D para el haz tangente al espacio-tiempo es un operador 4 que a cada campo vectorial υ le asocia un mapeo del espacio de los campos vectoriales, que denotaremos como 𝒱, en si mismo,
que cumple con las siguientes propiedades
con υ, u, υ1, y υ2 campos vectoriales arbitrarios, α cualquier constante y f una función arbitraria tambiéniii
Vemos entonces que una conexión es un objeto que tras actuar sobre dos campos vectoriales, υ y υ1 en las ecuaciones anteriores, resulta en otro campo vectorial dado por Dυ(υ1).El que Dυ(υ1) sea un campo vectorial implica que es un objeto que está listo para actuar linealmente sobre cualquier 1-forma y arrojar una función cumpliendo con las igualdades,
para una función arbitraria f.
Del párrafo anterior vemos que es factible visualizar a una conexión como un objeto que es capaz de actuar sobre dos campos vectoriales y una 1-forma resultando en una función. A pesar de esta observación, esto no implica que una conexión sea un tensor, dado que su acción no es lineal para todos los objetos sobre los que actúa. En particular, aunque (15), (16), (17) y (18) indican que la acción de la conexión es lineal sobre el espacio de las funciones para dos de los objetos sobre los que actúa, la propiedad (14) muestra que la acción de la conexión no cumple con ser lineal para el tercer objeto.
Es fácil ver como una conexión sobre el haz tangente determina a una conexión tanto en el haz cotangente como sobre los espacios de campos tensoriales de rangos arbitrarios. Esta generalización no es necesaria para el desarrollo del argumento de este artículo, pero para aquellos lectores que deseen un breve recordatorio de estos detalles, así como de la definición operacional de un campo vectorial, hemos incluido el Apéndice B. En general en lo que resta del artículo cuando hablemos de una conexión, nos referiremos a una conexión para el haz tangente al espacio-tiempo.
De importancia central al argumento de este artículo es recordar (4) que dada una conexión D, cualquier otra conexión D' se puede escribir sumándole a la primera una 1-forma A cuyos componentes son mapeos lineales del espacio tangente en si mismo,
Para que (19) tenga sentido, recordemos que las 1-formas con entradas reales, que son las que hemos visto hasta ahora, al actuar sobre un campo vectorial, resultan en una función, es decir, un objeto que asocia un real a cada punto del espacio base. De forma análoga al párrafo anterior, una 1-forma cuyos componentes son mapeos lineales es un objeto que al actuar sobre un campo vectorial υ da lugar a Aυ, que es un objeto que asocia un mapeo lineal para cada punto de la variedad base. La información que A codifica es la forma en que se deben transportar los vectores del espacio tangente, representada por la acción de la transformación lineal Aυ sobre de ellos, al desplazarse en la dirección dada por υ, para acomodar la diferencia entre las conexiones. En breve confirmaremos que en efecto A es una 1-forma cuyos componentes son campos de mapeos lineales.
Más adelante nos daremos cuenta de que la pregunta relevante a la presente discusión es respecto a la naturaleza de A, en particular si es un tensor o no, así que analicemos con cuidado los elementos que la constituyen.
Un mapeo lineal (7) del espacio tangente en si mismo, es un objeto que actúa linealmente sobre un vector y resulta en otro vector. Un objeto L que asocia un mapeo lineal a cada punto del espacio tiempo es aquel que actúa linealmente sobre un campo vectorial y resulta en otro campo vectorial, L(υ) = u, donde a cada campo vectorial υ le corresponde un campo vectorial u específico. Las condiciones de linealidad son las usuales
con f una función arbitraria.
Como habíamos mencionado antes, un vector es un mapeo lineal del espacio de los covectores a los reales. El objeto resultante de actuar con un mapeo lineal sobre un vector es otro vector, y por lo tanto este objeto resultante es un mapeo lineal de los covectores a los reales. De lo anterior concluimos que un objeto L que asocia un mapeo lineal a cada punto del espacio tiempo, tras actuar sobre un campo vectorial υ, es otro campo vectorial L(υ) = u ∈ 𝒱, y por lo tanto L(υ) es un objeto listo para actuar linelamente sobre una 1-forma ω y arrojar una función f,
donde a cada co-vector ω le corresponde una función específica f.
A partir de (20) y dada la linealidad de la acción de L(υ) sobre ω, vemos que podemos pensar a L como un mapeo multilineal que actúa sobre un campo vectorial υ y una 1-forma ω, y resulta en una función, es decir, podemos pensar en L como un campo tensorial de rango (1,1).
Hemos dicho, sin aún demostrarlo, que A es una 1-forma cuyos componentes son mapeos lineales, pero si este es el caso, vemos que A es un tensor de rango (1, 2) pues A, tras haber actuado linealmente sobre un campo vectorial υ, resulta en Aυ, un mapeo lineal en cada punto del espacio, que según lo visto en el párrafo anterior, es un campo tensorial de rango (1,1)con lo que en total A actúa multilinealmente sobre dos campos vectoriales y una 1-forma, resultando en una función escalar.
Para finalmente ver que A es una 1-forma cuyos componentes son mapeos lineales, notemos que (19) puede ser reescrito como A = D' - D. A partir de las propiedades (11) a (16) vemos que si bien el resultado de actuar con D sobre los campos vectoriales υi es otro vector, también notamos, en particular a partir de (14), que este no es un mapeo lineal de 𝒱 en si mismo. Para demostrar que sin embargo la acción de A sobre los vectores υi sí es la de una transformación lineal en cada punto del espacio basta con verificar dos propiedades, una es que Aυ(υi) es lineal sobre el espacio de las funciones en su acción sobre υi, y la otra es que el resultado de Aυ(υi) en el punto p sólo depende del vector tangente (υi)p, y no del comportamiento del campo vectorial υi en la vecindad de p.
La propiedad de linealidad de la acción de Aυ sobre la suma de vectores está garantizada por (13), y para verificar la linealidad sobre el espacio de las funciones basta ver que
La segunda propiedad que queremos comprobar es que
Dado que la suma o la resta de dos campos vectoriales es un campo vectorial, υ1 -υ2 cae en esta categoría y puede ser escrito como υ1 -υ2 = g u, para algún campo no nulo u y una función g que debe cumplir con g(p) = 0, dado que (υ1)p = (υ2)p y dado que u(p) ≠ 0, por ser no nulo. Continuamos con el cálculo sustituyendo g u en lugar de υ1 -υ2 y echando mano de (21),
y concluimos así que
Puesto que g(p) = 0, la evaluación de (24) en
p pdemuestra que
Con esto hemos verificado que (Aυ)p es un mapeo lineal, del espacio tangente al punto p en si mismo, y dadas las propiedades de linealidad respecto a υ en (11) - (16), queda demostrado que A en efecto es una 1-forma con mapeos lineales por componentes y con ello que A asigna a cada punto p un tensor de rango (1,2). Dicho de otra forma, A es un campo tensorial de rango (1,2).
5. La derivada covariante
Con lo que se ha establecido en las secciones anteriores nos encontramos en posición de exponer los resultados principales de este trabajo, sin embargo, para que estos se aprecien con la importancia que tienen, es necesario explicar el contexto físico en que son relevantes.
Uno de los dos paradigmas principales de la Relatividad General es notar que lo que percibimos como fuerza gravitacional es en realidad un efecto de la curvatura del espaciotiempo. Las implicaciones de que el espacio en que se desarrolla la física sea curvo son muy amplias, pero nos enfocaremos ahora en los de mayor relevancia para la presente discusión.
Los vectores tangentes en un punto p1 del espaciotiempo, que representan cantidades físicas de mucha importancia, existen en el espacio tangente a p1. Cuando el espaciotiempo es curvo, no hay una forma obvia de identificar a los elementos del espacio tangente en un punto p1 con los del espacio tangente en otro punto p2, pues, aunque isomórficos, no son el mismo espacio. En el caso plano la observación anterior es cierta también, pero la planitud del espacio hace posible imaginar una manera de identificar los vectores tangentes de puntos diferentes. En términos pictóricos, la noción de transportar un vector de p1 a p2 sin modificar ni la dirección en la que apunta ni su magnitud parece intuitiva e incluso podemos pensar en codificarla como que la derivada del vector en la dirección en que se está trasladando sea cero.
Nos gustaría extender esta idea intuitiva de trasportar un vector sin modificarlo al caso de los espacios curvos, así que veamos como la conexión introducida en la sección anterior nos ayuda a ello.
Lo primero por notar es que la conexión Dυ(υ1) actúa sobre υ1 como un operador de derivación, lo cual es particularmente claro a partir de (14). Parecería entonces que demandar Dγ'(υ1) = 0 a lo largo de una curva γ que conecta p1 con p2 y cuyo vector tangente es γ' en cada punto de la trayectoria, garantizaría el que el vector υ1 se transporte sin cambio al recorrer γ. A este proceso se le llama transporte paralelo del vector υ1 a lo largo de γ.
Como vimos en la sección anterior, la conexión dista mucho de ser única, pues tenemos tanta libertad para elegirla como la que hay para fijar a A. Parecería entonces que no hemos logrado mucho, pues lo que entendemos por trasportar paralelamente a un vector es tan arbitrario como la elección de A, así que la única forma en que una conexión nos puede ayudar a determinar una manera de comparar vectores en puntos distintos es si existe un criterio que seleccione una A particular como la mejor elección.
En Relatividad General existe un criterio para preferir a una A sobre las demás, pues esta es una teoría geométrica, lo que atribuye un carácter de primordial importancia a la cantidad g(υ1,υ2).Si hemos de considerar que dos vectores no cambian al transportarse paralelamente, una cantidad asociada a ellos tan fundamental como lo es g(υ1,υ2) no debe de cambiar al darse este tipo de transporte para υ1 y υ2 a lo largo de una trayectoria arbitraria. Lo interesante de esta observación es que satisfacer el criterio recién descrito es suficiente para determinar de forma única a la conexión que se debe usar.
El criterio del párrafo anterior se reduce a encontrar aquella A tal que baste que se cumpla Dγ'(υ1) = Dγ'(υ2) = 0 para garantizar que Dγ'g(υ1, υ2) = 0. La forma más rápida de demostrar que esta A es única es probablemente introduciendo índices coordenados, en términos de los cuales Dγ'g(υ1, υ2) se escribe como
y dado que D actúa sobre un producto de acuerdo a la ley de Leibnitz, las condiciones Dγ'(υ1) = Dγ'(υ2) = 0 implican
Esta última condición se cumple para cualesquiera vectores transportados paralelamente a lo largo de cualquier curva si y sólo si
Lo que queda por hacer es mostrar que (25) define de forma única a D y en consecuencia a A también, claro que, dado que los objetos así definidos son especiales, les daremos un nombre distinto, que será ∇ a la primera y Γ a la segunda para el caso en que escribamos la acción de ∇ en comparación con la derivada parcial coordenada, es decir, ∇ = ∂ + Γ.
Considerando que, como vimos en la sección anterior, Γ es una 1-forma con valores
endomórficos, podemos escribirla como la combinación lineal
que en vista de (25) implica
y permutando índices también
Usando la combinación lineal adecuada de las ecuaciones anteriores podemos escribir
relación que define de manera única a todos los coeficientes
La ecuación (30) es la expresión que permite calcular a los
Antes de llegar a los resultados principales del presente artículo, queremos insistir en la importancia de la conexión covariante, pues el preservar a la métrica ante el trasporte paralelo es lo que hace posible que la determinación de distancias pueda ser consistente en toda la extensión del espaciotiempo. Aún más, toda conexión confiere una cierta curvatura al espacio sobre el que está definida, pero la conexión covariante define a la curvatura que resulta de preservar la estructura métrica, convirtiéndose así en la curvatura relevante para Relatividad General y el elemento que permite escribir la ecuación de Einstein. Es por ello que es tan importante entender a fondo la naturaleza de esta conexión y los símbolos de Christoffel que están inevitablemente atados a ella.
6. Los símbolos de Christoffel
Como vimos en la sección anterior, los símbolos de Christoffel
Esto parecería estar en clara contradicción con la expresión (30) que encontramos para calcular los símbolos de Christoffel a partir de la métrica, pues esta no transforma como un tensor ante cambios de coordenadas y, de acuerdo a lo que revisamos en la Sec. (2), esto implicaría que Γ no es un tensor.
El que (30) no transforma como tensor es fácil de ver, incluso con un ejemplo simple, como es el caso de un espacio plano dos dimensional.
Primero, por cálculo directo notamos que si la métrica en coordenadas cartesianas,
se usa en (30) obtenemos que todos los componentes de los símbolos de Christoffel se anulan, mientras que si usamos la métrica polar,
para el mismo espacio y la insertamos en (30) tendremos que hay tres componentes de los símbolos de Christoffel,
que son distintos de cero.
Para contrastar con el cálculo directo, queremos partir de los símbolos de Christoffel obtenidos al usar la métrica cartesiana en (30) y aplicarles una transformación tensorial de coordenadas para comparar el resultado con (33).
La trasformación entre coordenadas cartesianas y polares x = r cos(θ), y = r sen(θ), da lugar a la transformación entre las componentes en términos de las bases de vectores coordenados
la cual está bien definida en todo lugar salvo en el origen.
Usando (34) y su inversa en (7) vemos que el aplicar la transformación a los símbolos de Christoffel nulos provenientes de la métrica cartesiana resulta en un nuevo conjunto de coeficientes que son nulos también, salvo en el origen donde no está definida la transformación, y por ello ahí no podemos comparar los coeficientes.
Con esto vemos que los resultados del cálculo directo de (30) en distintas coordenadas no están relacionados por una transformación tensorial. Como se mencionó antes, esto parece conducirnos a una contradicción irreconciliable, de cuyo origen hablamos a continuación.
7. Sobre la naturaleza tensorial o falta de ella en los símbolos de Christoffel
La solución a la tensión entre los resultados expuestos en lo anterior de este escrito se resuelve más fácilmente de lo que parecería a primera vista. El punto central es que no existe tal tensión, pues ambos resultados son correctos y a continuación veremos porque.
Para estudiar al objeto Γ, examinemos a los tres elementos involucrados en la relación que lo define
Notemos primero que ∇ es el operador derivada covariante, dado por la conexión de Levi-Civita, que es única para cada métrica y cuya acción específica sobre vectores es independiente de las coordenadas en las que se hagan los cálculos. En contraste, ∂ es un objeto que denota el cálculo del cambio infinitesimal de cualquier cantidad, en particular, de un vector, al ser evaluado en puntos desplazados infinitesimalmente a lo largo de las direcciones dictadas por el sistema coordenado. Es por esta característica de ∂ que, aunque sea común escribirlo como el mismo objeto en cualquiera que sea el sistema de coordenadas que se esté usando, en realidad ∂ denota un objeto matemático distinto en cada sistema coordenado.
De forma concreta, ∇ es el mismo objeto en todo sistema de coordenadas y simplemente tiene distintas representaciones acorde a los distintos sistemas coordenados, mientras que ∂ es un objeto diferente para cada sistema coordenado. Al ser Γ definido en términos de estos dos objetos, es claro que Γ mismo no es un único objeto para todos los sistemas de coordenadas, sino que para cada sistema existe un objeto Γ no necesariamente igual para todos ellos.
La fórmula (30) proporciona los componentes para el objeto Γ correspondiente al sistema coordenado que use a g como métrica, que, reiterando, no tiene por qué ser el mismo objeto que el Γ de otros sistemas coordenados. Siendo los componentes obtenidos a partir de (30) en distintos sistemas coordenados los componentes de objetos simplemente diferentes, estos no están obligados a guardar relación alguna entre ellos.
De esta manera vemos que no existe una contradicción en los resultados de secciones previas, pues si bien Γ es un tensor, el tensor que llamamos Γ puede ser un tensor distinto en dos sistemas de coordenadas diferentes, hecho que se refleja en que los componentes dados por (30) en diversos sistemas coordenados, siendo los componentes de tensores distintos, no se relacionan por medio de una transformación tensorial.
La discusión anterior concluye nuestros argumento, con lo que sólo nos resta incluir los apéndices indicados en el texto principal.