Sobre la naturaleza, tensorial o no tensorial, de los símbolos de Christoffel

Patiño, L.; Söhle, J.; Patiño, L.; Söhle, J.

Services on Demand

Journal

Article

Indicators

Cited by SciELO
Access statistics

Revista mexicana de física E

Print version ISSN 1870-3542

Rev. mex. fís. E vol.62 n.1 México Jan./Jun. 2016

Education

Sobre la naturaleza, tensorial o no tensorial, de los símbolos de Christoffel

L. Patiño^a

J. Söhle^a

^{^a}Facultad de Ciencias, Universidad Nacional Autónoma de México, Apartado Postal 50-542, México D.F. 04510, México, e-mail: leopj@ciencias.unam.mx; urkek.kanatlarinda@gmail.com

RESUMEN

Al estudiar un primer curso de Relatividad General y aprender sobre los símbolos de Christoffel, es fácil notar que sus componentes coordenadas no transforman como lo haría un tensor. Es por ello que resulta confuso encontrar libros de texto de alto prestigio en el área que se refieren a estos símbolos como si fueran un tensor, siendo un ejemplo notable de estos libros el escrito por Robert Wald ¹, que ha sido usado como libro de texto estándar en muchas instituciones a nivel mundial. La alternativa más simple sería suponer que los libros como los mencionados en el párrafo anterior describen a los símbolos de Christoffel de manera equivocada, pero esto no es el caso. Entender el fundamento matemático por el cual ciertos autores deliberadamente se refieren a los símbolos de Christoffel como si fueran un tensor aporta un entendimiento relevante de la naturaleza de la conexión métrica en Relatividad General, y es por ello que en este artículo nos hemos dado a la labor de presentar el análisis necesario. La discusión aquí presentada está enfocada a estudiantes que hayan tomado al menos un curso de relatividad general, así que algunas de las herramientas teóricas se considerarán conocidas.

Descriptores: Relatividad general; símbolos de Christoffel; tensores

ABSTRACT

From the first approach to General Relativity we learn about the Christoffel symbols, and it is easy to notice that their coordinated components do not transform as a tensor. It is then confusing to find renowned books on the subject that refer to these symbols as if they were indeed a tensor. A prominent example of such a book is the one written by Rober Wald ¹, which has been embraced as a textbook on the matter by a large amount of prestigious institutions around the globe. The simplest alternative would be to think that the books just mentioned provide a wrong description of the Christoffel symbols, but this is not the case. Understanding the mathematical foundation of why some authors treat the Christoffel symbols as a tensor provides valuable insight about the nature of the metric connection in General Relativity, and that is why in this paper we dedicate the space to provide the needed analysis. The discussion provided here is aimed to those that have already taken at least one class in General Relativity, hence some of the theoretical tools will be taken as known by the reader.

Keywords: General relativity; Christoffel symbols; tensors

PACS: 04.20.-q; 02.40.Hw

1. Introducción

La esencia de la Relatividad General de Einstein radica en tratar a los fenómenos gravitacionales como una consecuencia de la geometría del espaciotiempo. En esta teoría, que consideramos la mejor descripción de la gravitación a la fecha, la materia y energía provocan que el espaciotiempo (²). se curve y a su vez, la materia en movimiento está obligada a seguir las trayectorias geodésicas del espaciotiempo mismo. Una geodésica se puede describir como una curva cuya tangente se transporta paralelamente a lo largo de si misma (³), pero para que el contenido de la frase anterior sea claro, es necesario entender en que consiste el transporte paralelo de vectores en un espaciotiempo curvo.

Transportar un vector conlleva a comparar vectores en puntos distintos del espaciotiempo, tarea que parecería ser sencilla si el espaciotiempo es plano, pero si el espaciotiempo es curvo, esta comparación requiere de alguna prescripción sobre como se modifican los vectores conforme nos desplazamos. Esta prescripción esta codificada en el objeto que llamamos conexión (⁴). En particular, la conexión que es relevante en Relatividad General es la conexión métrica, que garantiza que el valor del producto interno, dictado por la métrica del espaciotiempo, entre dos vectores cualesquiera, no se modifique al trasportarlos usando esta conexión (²).

Como vemos de los párrafos anteriores, la importancia de la conexión en el contexto de la Relatividad General es muy grande. Así mismo, un principio fundamental de la teoría es que su formulación sea independiente de las coordenadas que arbitrariamente elijamos para describirla, por lo que es muy importante conocer la forma en que los distintos objetos de relevancia para la teoría transforman ante un cambio de este tipo.

En este artículo estudiamos las propiedades que tienen los símbolos de Christoffel ante transformaciones de coordenadas a través de estudiar si son de carácter tensorial o no. El lector se dará cuenta a lo largo del presente escrito de que el análisis que se propone en la frase anterior es más sutil de lo que se pensaría a partir de una simple inspección de la expresión coordenada de los símbolos de Christoffel en términos de la métrica.

2. Tensores

Iniciemos nuestra discusión recordando al lector la definición de tensor, seguido por una pequeña serie de comentarios sobre ella para ganar familiaridad con este tipo de objetos matemáticos y en particular con la forma operacional en que serán utilizados en este trabajo. Para el beneficio del lector que así lo requiera, pero para no disminuir la continuidad del argumento, se han incluido un número de apéndices con recordatorios sobre algunos temas necesarios de álgebra lineal y geometría diferencial, dejando en el texto principal solamente los puntos clave para la exposición.

Un tensor T de rango (m, n) es un operador multilineal que actúa sobre m co-vectores, o vectores duales, y n vectores, resultando en un número real (⁵), es decir,

T:V*×V*×...×V*×V×...×V→R, (1)

donde V, que se repite n veces, es un espacio vectorial y V*, que se repite m veces, es el espacio dual al V.

El que este mapeo sea multilineal quiere decir que cumple con las siguiente propiedades. Si cualquiera de los vectores o co-vectores sobre los que actúa se escribe como una suma de dos vectores o co-vectores, el resultado de la acción de T sobre este nuevo conjunto será la suma de las acciones sobre los conjuntos que tengan a cada vector o co-vector entre ellos, es decir, que la igualdad

T(u1,...,um,v1,...,vi1+vi2,...,vn)=T(u1,...,um,v1,...,vi1,...,vn)+T(u1,...,um,v1,...,vi2,...,vn), (2)

se cumple independientemente de la entrada en que se reemplace el elemento por una suma. La otra propiedad a cumplir es que si cualquiera de los vectores o co-vectores sobre los que actúa se reemplaza por un múltiplo de si mismo, el resultado de la acción de T sobre este nuevo conjunto será el mismo múltiplo de veces el resultado de actuar con T sobre el conjunto original de vectores y co-vectores, es decir, que la igualdad

T(u1,...,um,v1,...,αvi,...,vn)=αT(u1,...,um,v1,...,vi,...,vn), (3)

se cumple independientemente de la entrada en que se multiplique por la constante α.

La noción de que un tensor es un objeto parecido a una matriz, pero probablemente con más índices, tiene que ver con que una matriz M puede tomar un vector renglón V₁ y un vector columna V₂^T, que en este caso toma el lugar de un co-vector, y mandarlos multilinealmente a un real por medio de la operación matricial V₁MV₂^T, Es en este sentido que una matriz puede actuar como un tensor de rango (1,1).

De particular importancia para la discusión central de este artículo es que de la definición de tensor vista arriba se sigue que un mapeo lineal 𝒯 de V al espacio T^(m,n) de tensores de rango (m, n).

T:V→T(m,n), (4)

es un tensor de rango (n, m + 1).

Para ver que la aseveración del párrafo anterior es cierta, basta con notar que tras haber actuado linealmente sobre un elemento de V, es decir, sobre un vector υ, 𝒯(υ) es un mapeo multilineal capaz de actuar sobre m co-vectores y n vectores. De lo anterior sigue que 𝒯 es en sí un mapeo que actúa multilinealmente sobre m co-vectores y n + 1 vectores en total para arrojar un número real, satisfaciendo en consecuencia la definición misma de un tensor de rango (n, m + 1).

De la misma forma, un mapeo multilineal

T:V*×V*×...×V*×V××...×V→T(m,n), (5)

donde V* se repite M veces y V se repite N, es un tensor de rango (M + m, N + n).

Respecto a la forma de escribir a un tensor, recordando que un vector υ de un espacio V provee un mapeo lineal del espacio dual V* a los reales^ⁱ, nos damos cuenta de que el espacio T^(m,n) de tensores de rango (m, n) es el producto tensorial de m veces V y n veces V*, de tal forma que un tensor de rango (m, n) se puede escribir usando la base de vectores e_i y su base dual e_j como

T=Ti1i2...imj1j2...jnei1×ei2×...×eim×ej1×ej2×...×ejn, (6)

donde cada uno de los multiíndices i_a, j_b toman valores entre 1 y D, con D la dimensionalidad de V, que es la misma que la de V*. La forma de entender (6) es notando que cada uno de los vectores eia actúa linealmente sobre un co-vector arbitrario y resulta en un real, así como cada uno de los co-vectores ejb actúa linealmente sobre un vector arbitrario y resulta en un real. Notamos así que cada uno de los términos ei1×ei2×...×eim×ej1×ej2×...×ejn en (6), es un objeto que actúa multilinelamente sobre n co-vectores y m vectores arbitrarios.

No es difícil ver que en la suma involucrada en (6) hay D^m+n elementos ei1×ei2×...×eim×ej1×ej2×...×ejn, y que ellos constituyen una base para el espacio de tensores T^(m,n), por lo que decimos entonces que los coeficientes Ti1i2...imj1j2...jn son las componentes del tensor T en esta base.

El resultado de la acción de un tensor de rango (m, n) sobre m co-vectores y n vectores dados debe de ser independiente de la base e_i (y el dual e^j) que se elija para representar a estos objetos. Esta observación implica que si hay dos bases distintas de vectores e_i y ẽĩ que se escriben una respecto a la otra según ẽĩ=Miĩei, las componentes de un tensor T respecto a la base ei y respecto a la base ẽĩ deben inevitablemente estar relacionadas de acuerdo a

T~i1~i2~...im~j1~j2~...jn~=Mj1j1~Mj2j2~…Mjnjn~(M-1)i1~i1(M-1)i2~i2…(M-1)im~imTi1i2...imj1j2...jn, (7)

pues solo así el resultado de la acción de T sobre los vectores y co-vectores escritos en términos de la base e será igual al resultado de T~ actuando sobre los vectores y co-vectores escritos en términos de la base ẽ.

Queda claro entonces que un objeto cuyas componentes transformen de forma distinta a (7) no puede ser un tensor.

3. Tensores en Relatividad General

Hasta el momento hemos hablado sólo de vectores, co-vectores y tensores construidos sobre un espacio V y su dual, pero, dado que estamos interesados en el formalismo de la relatividad general, debemos recordar que en ella los vectores existen en los espacios tangentes al espacio-tiempo en cada punto p de este (⁶). Dicho de otra forma, cada punto p tiene asociado un espacio vectorial V dado por el espacio tangente en ese punto. Cada uno de estos espacios vectoriales se puede usar para construir el espacio dual V* y con ello, los espacios tensoriales de cualquier rango.

Llamemos entonces υ_p a los elementos del espacio tangente en el punto p, y υ_p a los elementos del espacio vectorial dual a este, llamado también espacio cotangente. El objeto que asocia un vector υ_p a cada punto p le llamamos campo vectorial^ⁱⁱ, y por simplicidad lo denotaremos υ. De igual forma podemos construir campos de vectores duales u que asocian un υp a cada punto p, y a estos campos los llamaremos 1-formas. Continuando en esta dirección, un campo tensorial debe de asociar un tensor a cada punto del espacio-tiempo, pero un tensor está definido por el mapeo multilineal discutido en la sección anterior, así que un campo tensorial T de rango (n, m) debe ser un objeto que actúa multilinealmente sobre n 1-formas y m campos vectoriales.

El resultado de actuar con una 1-forma u sobre un campo vectorial υ es fácil de visualizar, pues el co-vector asociado a cada punto υ_p debe actuar sobre el vector asociado al mismo punto υ_p y arrojar un número real. Un objeto que asocia un número real a cada punto del espacio es una función real, así que una 1-forma actúa sobre un campo vectorial y resulta en una función real. Para respetar la linealidad de la acción en cada punto que debe cumplir cualquier co-vector al operar sobre un vector, es necesario que las relaciones

uv1+v2=u(v1)+u(v2) y (8)

uf v=fu(v) (9)

se satisfagan para cualesquiera vectores υ, υ₁, υ₂ y función f arbitrarios.

De la misma forma, la acción de un campo tensorial T sobre las 1-formas y los campos vectoriales correspondiente a su rango debe ser una función real. Para implementar la multilinealidad de T en este contexto, notamos que (2) y (3) se deben cumplir en todo punto p del espacio-tiempo, y considerando que una función real f asocia un número real α a cada p, no es difícil convencerse de que las relaciones de multilinealidad que se deben cumplir para un campo tensorial son una idéntica a (2) con 1-formas y campos vectoriales y otra dada por

T(u1,...,um,v1,...,fvi,...,vn)=fT(u1,...,um,v1,...,vi,...,vn). (10)

Vemos entonces que (10) se reduce a (3) al ser evaluada en un punto particular p, pues f(p) = α, pero aún más importante es que α está determinado exclusivamente por el valor de f en el punto p, y para este valor es irrelevante el comportamiento de f en una vecindad de p. Nos referimos a este comportamiento como que T es multilineal sobre el espacio de las funciones.

4. Conexiones

Una conexión D para el haz tangente al espacio-tiempo es un operador ⁴ que a cada campo vectorial υ le asocia un mapeo del espacio de los campos vectoriales, que denotaremos como 𝒱, en si mismo,

Dv:V→V, (11)

que cumple con las siguientes propiedades

Dυαv1 =αDυ(υ1), (12)

Dυυ1+υ2 =Dυ(υ1)+Dυ(υ2), (13)

Dυfυ1=υ(f)υ1+fDυ(υ1), (14)

Dυ+uυ1 =Dυ(υ1)+Du(υ1), (15)

Dfυαυ1= fDυ(υ1), (16)

con υ, u, υ₁, y υ₂ campos vectoriales arbitrarios, α cualquier constante y f una función arbitraria también^ⁱⁱⁱ

Vemos entonces que una conexión es un objeto que tras actuar sobre dos campos vectoriales, υ y υ₁ en las ecuaciones anteriores, resulta en otro campo vectorial dado por D_υ(υ₁).El que D_υ(υ₁) sea un campo vectorial implica que es un objeto que está listo para actuar linealmente sobre cualquier 1-forma y arrojar una función cumpliendo con las igualdades,

Dvv1ω1+ω2= Dv(v1)[ω1]+Dv(v1)[ω2], y (17)

Dvv1fω= fDv(v1)[ω], (18)

para una función arbitraria f.

Del párrafo anterior vemos que es factible visualizar a una conexión como un objeto que es capaz de actuar sobre dos campos vectoriales y una 1-forma resultando en una función. A pesar de esta observación, esto no implica que una conexión sea un tensor, dado que su acción no es lineal para todos los objetos sobre los que actúa. En particular, aunque (15), (16), (17) y (18) indican que la acción de la conexión es lineal sobre el espacio de las funciones para dos de los objetos sobre los que actúa, la propiedad (14) muestra que la acción de la conexión no cumple con ser lineal para el tercer objeto.

Es fácil ver como una conexión sobre el haz tangente determina a una conexión tanto en el haz cotangente como sobre los espacios de campos tensoriales de rangos arbitrarios. Esta generalización no es necesaria para el desarrollo del argumento de este artículo, pero para aquellos lectores que deseen un breve recordatorio de estos detalles, así como de la definición operacional de un campo vectorial, hemos incluido el Apéndice B. En general en lo que resta del artículo cuando hablemos de una conexión, nos referiremos a una conexión para el haz tangente al espacio-tiempo.

De importancia central al argumento de este artículo es recordar (⁴) que dada una conexión D, cualquier otra conexión D' se puede escribir sumándole a la primera una 1-forma A cuyos componentes son mapeos lineales del espacio tangente en si mismo,

D'=D+A. (19)

Para que (19) tenga sentido, recordemos que las 1-formas con entradas reales, que son las que hemos visto hasta ahora, al actuar sobre un campo vectorial, resultan en una función, es decir, un objeto que asocia un real a cada punto del espacio base. De forma análoga al párrafo anterior, una 1-forma cuyos componentes son mapeos lineales es un objeto que al actuar sobre un campo vectorial υ da lugar a A_υ, que es un objeto que asocia un mapeo lineal para cada punto de la variedad base. La información que A codifica es la forma en que se deben transportar los vectores del espacio tangente, representada por la acción de la transformación lineal A_υ sobre de ellos, al desplazarse en la dirección dada por υ, para acomodar la diferencia entre las conexiones. En breve confirmaremos que en efecto A es una 1-forma cuyos componentes son campos de mapeos lineales.

Más adelante nos daremos cuenta de que la pregunta relevante a la presente discusión es respecto a la naturaleza de A, en particular si es un tensor o no, así que analicemos con cuidado los elementos que la constituyen.

Un mapeo lineal (⁷) del espacio tangente en si mismo, es un objeto que actúa linealmente sobre un vector y resulta en otro vector. Un objeto L que asocia un mapeo lineal a cada punto del espacio tiempo es aquel que actúa linealmente sobre un campo vectorial y resulta en otro campo vectorial, L(υ) = u, donde a cada campo vectorial υ le corresponde un campo vectorial u específico. Las condiciones de linealidad son las usuales

L(υ1+υ2)=L(υ1)+L(υ2) yL(f υ)=f L(υ) (20)

con f una función arbitraria.

Como habíamos mencionado antes, un vector es un mapeo lineal del espacio de los covectores a los reales. El objeto resultante de actuar con un mapeo lineal sobre un vector es otro vector, y por lo tanto este objeto resultante es un mapeo lineal de los covectores a los reales. De lo anterior concluimos que un objeto L que asocia un mapeo lineal a cada punto del espacio tiempo, tras actuar sobre un campo vectorial υ, es otro campo vectorial L(υ) = u ∈ 𝒱, y por lo tanto L(υ) es un objeto listo para actuar linelamente sobre una 1-forma ω y arrojar una función f,

L(υ)[ω]=f,

donde a cada co-vector ω le corresponde una función específica f.

A partir de (20) y dada la linealidad de la acción de L(υ) sobre ω, vemos que podemos pensar a L como un mapeo multilineal que actúa sobre un campo vectorial υ y una 1-forma ω, y resulta en una función, es decir, podemos pensar en L como un campo tensorial de rango (1,1).

Hemos dicho, sin aún demostrarlo, que A es una 1-forma cuyos componentes son mapeos lineales, pero si este es el caso, vemos que A es un tensor de rango (1, 2) pues A, tras haber actuado linealmente sobre un campo vectorial υ, resulta en A_υ, un mapeo lineal en cada punto del espacio, que según lo visto en el párrafo anterior, es un campo tensorial de rango (1,1)con lo que en total A actúa multilinealmente sobre dos campos vectoriales y una 1-forma, resultando en una función escalar.

Para finalmente ver que A es una 1-forma cuyos componentes son mapeos lineales, notemos que (19) puede ser reescrito como A = D' - D. A partir de las propiedades (11) a (16) vemos que si bien el resultado de actuar con D sobre los campos vectoriales υ_i es otro vector, también notamos, en particular a partir de (14), que este no es un mapeo lineal de 𝒱 en si mismo. Para demostrar que sin embargo la acción de A sobre los vectores υi sí es la de una transformación lineal en cada punto del espacio basta con verificar dos propiedades, una es que A_υ(υ_i) es lineal sobre el espacio de las funciones en su acción sobre υ_i, y la otra es que el resultado de A_υ(υ_i) en el punto p sólo depende del vector tangente (υ_i)p, y no del comportamiento del campo vectorial υ_i en la vecindad de p.

La propiedad de linealidad de la acción de A_υ sobre la suma de vectores está garantizada por (13), y para verificar la linealidad sobre el espacio de las funciones basta ver que

Aυ(f υi)=D'υ-Dυ(f υi)=D'υ(f υi)-Dυ(f υi)=(∂υ(f) υi+f D'υ(υi))-(∂υ(f) υi+f Dυ(υi))=f D'υ(υi)-f Dυ(υi)=fD'υ-Dυ(υi)=fAυ(υi). (21)

La segunda propiedad que queremos comprobar es que [Aυ(υ1)]p=[Aυ(υ2)]p para cualesquiera dos campos vectoriales υ₁ y υ₂ que cumplan con ser iguales en el punto p, pero en general diferentes en una vecindad alrededor de este. Primero reescribimos [Aυ(υ1)]p=[Aυ(υ2)]p como [Aυ(υ1)]p=[Aυ(υ2)]p=0 y notamos que dadas (11) a (16) en general

Aυυ1-Aυυ2=[D'υ-Dυ](υ1)-[D'υ-Dυ](υ2) (22)

=[D'υ-Dυ](υ1-υ2). (23)

Dado que la suma o la resta de dos campos vectoriales es un campo vectorial, υ₁ -υ₂ cae en esta categoría y puede ser escrito como υ₁ -υ₂ = g u, para algún campo no nulo u y una función g que debe cumplir con g(p) = 0, dado que (υ₁)p = (υ₂)p y dado que u(p) ≠ 0, por ser no nulo. Continuamos con el cálculo sustituyendo g u en lugar de υ₁ -υ₂ y echando mano de (21),

D'υ-Dυ(υ1-υ2)=D'υ-Dυ(g u)=gD'υ-Dυ(u),

y concluimos así que

Aυ(υ1)-Aυ(υ2)=gD'υ-Dυ(u). (24)

Puesto que g(p) = 0, la evaluación de (24) en p pdemuestra que [Aυ(υ1)]p=[Aυ(υ2)]p siempre que υ₁ y υ₂ sean iguales en p, independientemente de su comportamiento en la vecindad de el.

Con esto hemos verificado que (A_υ)p es un mapeo lineal, del espacio tangente al punto p en si mismo, y dadas las propiedades de linealidad respecto a υ en (11) - (16), queda demostrado que A en efecto es una 1-forma con mapeos lineales por componentes y con ello que A asigna a cada punto p un tensor de rango (1,2). Dicho de otra forma, A es un campo tensorial de rango (1,2).

5. La derivada covariante

Con lo que se ha establecido en las secciones anteriores nos encontramos en posición de exponer los resultados principales de este trabajo, sin embargo, para que estos se aprecien con la importancia que tienen, es necesario explicar el contexto físico en que son relevantes.

Uno de los dos paradigmas principales de la Relatividad General es notar que lo que percibimos como fuerza gravitacional es en realidad un efecto de la curvatura del espaciotiempo. Las implicaciones de que el espacio en que se desarrolla la física sea curvo son muy amplias, pero nos enfocaremos ahora en los de mayor relevancia para la presente discusión.

Los vectores tangentes en un punto p₁ del espaciotiempo, que representan cantidades físicas de mucha importancia, existen en el espacio tangente a p₁. Cuando el espaciotiempo es curvo, no hay una forma obvia de identificar a los elementos del espacio tangente en un punto p₁ con los del espacio tangente en otro punto p₂, pues, aunque isomórficos, no son el mismo espacio. En el caso plano la observación anterior es cierta también, pero la planitud del espacio hace posible imaginar una manera de identificar los vectores tangentes de puntos diferentes. En términos pictóricos, la noción de transportar un vector de p₁ a p₂ sin modificar ni la dirección en la que apunta ni su magnitud parece intuitiva e incluso podemos pensar en codificarla como que la derivada del vector en la dirección en que se está trasladando sea cero.

Nos gustaría extender esta idea intuitiva de trasportar un vector sin modificarlo al caso de los espacios curvos, así que veamos como la conexión introducida en la sección anterior nos ayuda a ello.

Lo primero por notar es que la conexión D_υ(υ₁) actúa sobre υ₁ como un operador de derivación, lo cual es particularmente claro a partir de (14). Parecería entonces que demandar D_γ'(υ₁) = 0 a lo largo de una curva γ que conecta p₁ con p₂ y cuyo vector tangente es γ' en cada punto de la trayectoria, garantizaría el que el vector υ₁ se transporte sin cambio al recorrer γ. A este proceso se le llama transporte paralelo del vector υ₁ a lo largo de γ.

Como vimos en la sección anterior, la conexión dista mucho de ser única, pues tenemos tanta libertad para elegirla como la que hay para fijar a A. Parecería entonces que no hemos logrado mucho, pues lo que entendemos por trasportar paralelamente a un vector es tan arbitrario como la elección de A, así que la única forma en que una conexión nos puede ayudar a determinar una manera de comparar vectores en puntos distintos es si existe un criterio que seleccione una A particular como la mejor elección.

En Relatividad General existe un criterio para preferir a una A sobre las demás, pues esta es una teoría geométrica, lo que atribuye un carácter de primordial importancia a la cantidad g(υ₁,υ₂).Si hemos de considerar que dos vectores no cambian al transportarse paralelamente, una cantidad asociada a ellos tan fundamental como lo es g(υ₁,υ₂) no debe de cambiar al darse este tipo de transporte para υ₁ y υ₂ a lo largo de una trayectoria arbitraria. Lo interesante de esta observación es que satisfacer el criterio recién descrito es suficiente para determinar de forma única a la conexión que se debe usar.

El criterio del párrafo anterior se reduce a encontrar aquella A tal que baste que se cumpla D_γ'(υ₁) = D_γ'(υ₂) = 0 para garantizar que D_γ'g(υ₁, υ₂) = 0. La forma más rápida de demostrar que esta A es única es probablemente introduciendo índices coordenados, en términos de los cuales D_γ'g(υ₁, υ₂) se escribe como

γ'μDμ(gνσυ1νυ2σ),

y dado que D actúa sobre un producto de acuerdo a la ley de Leibnitz, las condiciones D_γ'(υ₁) = D_γ'(υ₂) = 0 implican

γ'μυ1νυ2σDμ(gνσ)=0.

Esta última condición se cumple para cualesquiera vectores transportados paralelamente a lo largo de cualquier curva si y sólo si

Dμ(gνσ)=0. (25)

Lo que queda por hacer es mostrar que (25) define de forma única a D y en consecuencia a A también, claro que, dado que los objetos así definidos son especiales, les daremos un nombre distinto, que será ∇ a la primera y Γ a la segunda para el caso en que escribamos la acción de ∇ en comparación con la derivada parcial coordenada, es decir, ∇ = ∂ + Γ.

Considerando que, como vimos en la sección anterior, Γ es una 1-forma con valores endomórficos, podemos escribirla como la combinación lineal Γ=(Γβα)δ(eα⊗eβ)⊗eδ de los elementos de las bases coordenadas e_α y e^β de vectores y 1-formas respectivamente. En la expresión anterior los paréntesis no son relevantes, pero los incluimos para hacer obvio que parte es la endomórfica y cual la de 1-forma. Usando estas componentes la acción de ∇ sobre g_νσ se puede escribir como

∇μ(gνσ)=∂μ(gνσ)-(Γνα)μgασ-(Γσα)μgαν, (26)

que en vista de (25) implica

∂μ(gνσ)=(Γνα)μgασ+(Γσα)μgαν, (27)

y permutando índices también

∂νgσμ= (Γσα)νgαμ+(Γμα)νgασ, (28)

∂σgμν= (Γμα)σgαν+(Γνα)σgαμ. (29)

Usando la combinación lineal adecuada de las ecuaciones anteriores podemos escribir

Γνσμ=12gμσ∂νgσσ+∂σgσν-∂σgνσ, (30)

relación que define de manera única a todos los coeficientes Γνσμ y en consecuencia a Γ misma, demostrando no sólo que es posible construirla de manera que cumpla con los requisitos discutidos previamente, sino que además, es única.

La ecuación (30) es la expresión que permite calcular a los Γνσμ, conocidos como los símbolos de Christoffel, en términos de los componentes de la métrica.

Antes de llegar a los resultados principales del presente artículo, queremos insistir en la importancia de la conexión covariante, pues el preservar a la métrica ante el trasporte paralelo es lo que hace posible que la determinación de distancias pueda ser consistente en toda la extensión del espaciotiempo. Aún más, toda conexión confiere una cierta curvatura al espacio sobre el que está definida, pero la conexión covariante define a la curvatura que resulta de preservar la estructura métrica, convirtiéndose así en la curvatura relevante para Relatividad General y el elemento que permite escribir la ecuación de Einstein. Es por ello que es tan importante entender a fondo la naturaleza de esta conexión y los símbolos de Christoffel que están inevitablemente atados a ella.

6. Los símbolos de Christoffel

Como vimos en la sección anterior, los símbolos de Christoffel Γνσμ son los componentes de Γ, que es un A muy particular dado por ∇ = ∂ + Γ, con ∂ la derivada coordenada y ∇ la derivada que cumple con la muy especial propiedad de conservar a la métrica ante el transporte paralelo. De esta aseveración, el punto relevante para esta sección y para el objetivo central del presente trabajo, es que los símbolos de Christoffel son un caso particular de A y por ello, según lo que demostramos en la Sec. (4), representan un campo tensorial de rango (1,2).

Esto parecería estar en clara contradicción con la expresión (30) que encontramos para calcular los símbolos de Christoffel a partir de la métrica, pues esta no transforma como un tensor ante cambios de coordenadas y, de acuerdo a lo que revisamos en la Sec. (2), esto implicaría que Γ no es un tensor.

El que (30) no transforma como tensor es fácil de ver, incluso con un ejemplo simple, como es el caso de un espacio plano dos dimensional.

Primero, por cálculo directo notamos que si la métrica en coordenadas cartesianas,

gμν=1001, (31)

se usa en (30) obtenemos que todos los componentes de los símbolos de Christoffel se anulan, mientras que si usamos la métrica polar,

g̃μν=100r2, (32)

para el mismo espacio y la insertamos en (30) tendremos que hay tres componentes de los símbolos de Christoffel,

Γθrθ=1r, Γθθr=1r y Γrθθ=-r, (33)

que son distintos de cero.

Para contrastar con el cálculo directo, queremos partir de los símbolos de Christoffel obtenidos al usar la métrica cartesiana en (30) y aplicarles una transformación tensorial de coordenadas para comparar el resultado con (33).

La trasformación entre coordenadas cartesianas y polares x = r cos(θ), y = r sen(θ), da lugar a la transformación entre las componentes en términos de las bases de vectores coordenados

Miĩ=cos(θ)-r sen(θ)sen(θ)rcos(θ), (34)

la cual está bien definida en todo lugar salvo en el origen.

Usando (34) y su inversa en (7) vemos que el aplicar la transformación a los símbolos de Christoffel nulos provenientes de la métrica cartesiana resulta en un nuevo conjunto de coeficientes que son nulos también, salvo en el origen donde no está definida la transformación, y por ello ahí no podemos comparar los coeficientes.

Con esto vemos que los resultados del cálculo directo de (30) en distintas coordenadas no están relacionados por una transformación tensorial. Como se mencionó antes, esto parece conducirnos a una contradicción irreconciliable, de cuyo origen hablamos a continuación.

7. Sobre la naturaleza tensorial o falta de ella en los símbolos de Christoffel

La solución a la tensión entre los resultados expuestos en lo anterior de este escrito se resuelve más fácilmente de lo que parecería a primera vista. El punto central es que no existe tal tensión, pues ambos resultados son correctos y a continuación veremos porque.

Para estudiar al objeto Γ, examinemos a los tres elementos involucrados en la relación que lo define

∇=∂+Γ. (35)

Notemos primero que ∇ es el operador derivada covariante, dado por la conexión de Levi-Civita, que es única para cada métrica y cuya acción específica sobre vectores es independiente de las coordenadas en las que se hagan los cálculos. En contraste, ∂ es un objeto que denota el cálculo del cambio infinitesimal de cualquier cantidad, en particular, de un vector, al ser evaluado en puntos desplazados infinitesimalmente a lo largo de las direcciones dictadas por el sistema coordenado. Es por esta característica de ∂ que, aunque sea común escribirlo como el mismo objeto en cualquiera que sea el sistema de coordenadas que se esté usando, en realidad ∂ denota un objeto matemático distinto en cada sistema coordenado.

De forma concreta, ∇ es el mismo objeto en todo sistema de coordenadas y simplemente tiene distintas representaciones acorde a los distintos sistemas coordenados, mientras que ∂ es un objeto diferente para cada sistema coordenado. Al ser Γ definido en términos de estos dos objetos, es claro que Γ mismo no es un único objeto para todos los sistemas de coordenadas, sino que para cada sistema existe un objeto Γ no necesariamente igual para todos ellos.

La fórmula (30) proporciona los componentes para el objeto Γ correspondiente al sistema coordenado que use a g como métrica, que, reiterando, no tiene por qué ser el mismo objeto que el Γ de otros sistemas coordenados. Siendo los componentes obtenidos a partir de (30) en distintos sistemas coordenados los componentes de objetos simplemente diferentes, estos no están obligados a guardar relación alguna entre ellos.

De esta manera vemos que no existe una contradicción en los resultados de secciones previas, pues si bien Γ es un tensor, el tensor que llamamos Γ puede ser un tensor distinto en dos sistemas de coordenadas diferentes, hecho que se refleja en que los componentes dados por (30) en diversos sistemas coordenados, siendo los componentes de tensores distintos, no se relacionan por medio de una transformación tensorial.

La discusión anterior concluye nuestros argumento, con lo que sólo nos resta incluir los apéndices indicados en el texto principal.

Agradecimientos

Queremos agradecer a Gary T. Horowitz, quien nos hizo notar por primera vez el porque de que Robert Wald se refería a los símbolos de Christoffel como un tensor. Agradecemos el apoyo del proyecto UNAM-DGAPA, PAPIIT IN 113115.

REFERENCIAS

1. R. M. Wald, “General Relativity” Chicago, USA: Univ. Pr. (1984) p. 491. [ Links ]

2. C. W. Misner, K. S. Thorne and J. A. Wheeler, “Gravitation” San Francisco (1973) p. 1279. [ Links ]

3. Barrett O’neill, “Semi-Riemannian Geometry with Applications to Relativity”; Academic Press. (1983) p. 54-62. [ Links ]

4. J. Baez and J. P. Muniain, “Gauge fields, knots and gravity” Singapore, Singapore: World Scientific (1994) p. 465. (Series on knots and everything, 4) [ Links ]

5. D. Lovelock and H. Rund, “Tensors, Differential Forms, and Variational Principles” Dover Publications, Inc., New York (1989). [ Links ]

6. Y. Choquet-Bruhat and C. DeWitt “Analysis, Manifolds and Physics, Part 1: Basics,” North Hollan, (1982) p. 656. [ Links ]

7. O. Bretscher, “Linear Algebra with Applications” Pearson Cloth, (2012) p. 528. [ Links ]

iPara recordar como un vector puede actuar sobre un co-vector se puede consultar el Apéndice A.

iiUna definición operacional de campo vectorial se puede encontrar en el Apéndice B.

iiiEn el Apéndice B se recuerda que υ(f) es la derivada de la función f en la dirección de υ.

Apéndice

A. Sobre los co-vectores

Para la presente discusión, supondremos que la noción de vector es familiar al lector, y haremos uso de ella para recordar en que consiste un co-vector ⁷.

Dado un espacio vectorial V de dimensión finita, consideremos un espacio V* cuyos elementos son todas las posibles funciones lineales υ* : V → R. Para los elementos de V*, definimos el resultado de la suma y multiplicación por escalar como el elemento de V* que para todo elemento de V cumple respectivamente con:

[υ*1+υ*2](v)=υ*1(υ)+υ*2(υ),[αυ*](υ)=α[υ*](υ). (A.1)

Notamos que de estas dos definiciones se sigue que V* cumple con todas las propiedades de un espacio vectorial. Al espacio vectorial resultante se le conoce como el dual de V, y tiene el mismo número de dimensiones que este.

Una demostración formal respecto a la dimensionalidad de V* aporta poca intuición respecto a la naturaleza de este espacio, sin embargo una forma simple de convencerse de que V* tiene el mismo número de dimensiones que V es como sigue. Consideremos un conjunto de D vectores ei que constituyan una base del espacio D-dimensional V y seleccionemos D elementos ei de V* que cumplan con eⁱ(e_j) = δⁱ_j. Usando las propiedades (A.1) es fácil ver que los elementos ei constituyen una base para V*, pues sólo es necesario notar que toda función lineal υ* : V → R se puede escribir como una combinación lineal de todos los ei y ninguno de ellos se puede escribir como una combinación de los restantes. Dado que, tras verificar lo que se enuncia en la frase anterior, notamos que hemos encontrado una base para V* y esta tiene D elementos, queda claro que la dimensionalidad de V* es la misma que la de V, y hemos ganado algo de intuición sobre el comportamiento de los elementos de V*.

Otra forma de visualizar el espacio dual es como el mismo espacio vectorial provisto de un producto interno. Sabemos que el producto interno asocia de forma bilineal un número real a todo par de vectores, pues υ ⋅ u ∈ R. De esta forma podemos pensar en υ⋅ como un objeto listo para actuar sobre cualquier vector u ∈ V. El resultado de esta operación será un número real, y no sólo eso, sino que υ⋅ establecerá un mapeo lineal de V a R, que será distinto para todo υ ∈ V que se elija para formarlo. En esta construcción es particularmente sencillo ver porque V* y V son espacios tan parecidos.

La forma en que hemos descrito a V* es a través de sus constituyentes siendo objetos que actúan sobre los elementos de V de la forma υ* (u) = a ∈ R, sin embargo, vemos que esta operación es simétrica, en el sentido de que a cada par constituido por un elemento de V* y uno de V se asocia multilinealménte un real. Dada la simetría apenas descrita, vemos que es igualmente válido pensar en que un co-vector actúa sobre un vector o que un vector actúa sobre un co-vector. Es en este sentido que, así como V* es el espacio dual a V, es posible pensar en V como isomorfo al espacio dual a V* y que sus elementos son mapeos lineales de V* a los reales.

B. Definición operacional de vector, conexiones sobre 1-formas y sobre campos tensoriales

A lo largo del texto hemos supuesto que el lector está familiarizado con el álgebra vectorial y que conoce la definición de un vector como un elemento de un espacio que cumple con una serie de características. En el contexto de la relatividad general, es muy conveniente conocer a los vectores, o campos vectoriales, a través de una definición independiente de las coordenadas que se elijan y que refleje más cercanamente el espíritu con el que se escribe la relatividad general. Empecemos entonces por ver la definición operacional de un campo vectorial ⁴.

Es común pensar en un vector como un objeto que dicta una dirección y que tiene una cierta magnitud. Es también familiar la noción de los operadores de derivada direccional sobre funciones, y en particular sabemos que esta dirección de diferenciación es especificada por un vector. Notemos ahora que, una derivada direccional al actuar sobre una función en algún punto del esapacio, resulta en un número, así que podemos pensar en una derivada direccional como un objeto que en cada punto del espacio base en que están definidas tanto ella como las funciones sobre las que actúa, establece un mapeo, υ_p, del espacio de las funciones, C^∞, a los reales. El hecho que nos es de interés, y que mencionamos sin demostrar, es que si se construye uno de estos mapeos υ_p por medio de especificar la acción que este tiene sobre todas y cada una de las funciones en C^∞, entonces existe una única dirección y una única magnitud tal que la derivada direccional en esta dirección de toda función coincide con el resultado de aplicar este mapeo.

Vemos entonces que los mapeos υ_p están en correspondencia uno a uno con los vectores en el punto p que especifican la dirección de derivación, y es por este motivo que se puede pensar en un vector tangente como un mapeo υ_p.

Ahora, si tomamos un objeto υ que asocie un mapeo υ_p a cada punto p del espacio, notamos que la acción υ(f) arroja un número υ_p(f) en cada punto p del espacio, es decir, υ(f) es una función sobre el espacio.

Tomando en cuenta los comentarios anteriores, vemos que tiene sentido definir a un campo vectorial υ como un mapeo del espacio de las funciones C^∞ en si mismo que cumple con

υ(f+g)=υ(f)+υ(g),υ(α f)=α υ(f),υ(f g)=υ(f) g+f υ(g),

con f, g ∈ C^∞y α un número real.

La definición anterior de υ tiene la ventaja de ser independiente de las coordenadas que se elijan, pues una función asocia un número a cada punto del espacio independientemente de las coordenadas que se usen para describirlo y lo mismo es cierto para la acción de υ sobre toda f.

Para hablar de la acción que tiene una conexión D sobre tensores de diversos rangos, empecemos por mencionar que la acción de cualquier conexión sobre una función f debe cumplir con D_υ(f) = υ(f), y es por ello que al resultado D_υ(E) se le llama la derivada en la dirección υ del objeto E.

Hasta el momento hemos hablado de la acción de D_υ sobre funciones y campos vectoriales así que toca el turno de generalizar esta noción.

A partir de la definición de conexión sobre el haz tangente, es fácil determinar como es una conexión sobre el haz cotangente ⁴, requiriendo que (14) se cumpla para productos más generales, y en particular que se cumpla

Dv[ω(w1)]=Dv(ω)[w1]+ω[Dv(w1)], (B.1)

y aún más, dado que ω(w₁) es una función, y υ puede actuar directamente sobre ella, también se debe cumplir que

Dv[ω(w1]=v[ω(w1)]. (B.2)

Usando (B.1) y (B.2) la acción de D_υ sobre ω queda determinada.

Basados en la acción de la conexión sobre vectores, 1-formas y funciones, así como pidiendo que para campos tensoriales de rangos arbitrarios se cumpla que

Dv[T1⊗T2]=Dv[T1]⊗[T2]+T1⊗Dv[T2], (B.3)

se puede determinar la acción de la conexión sobre cualquier campo tensorial del rango que se desee ⁴.

Recibido: 26 de Agosto de 2015; Aprobado: 26 de Octubre de 2015

Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons