Del átomo al Higgs VII: Dificultades iniciales de las teorías gauge entre 1954 y 1961

Cuando yo empleo una palabra —insistió Humpty Dumpty en tono desdeñoso— significa lo que yo quiero que signifique…, ¡ni más ni menos!

Lewis Carroll, A Través del Espejo y lo que Alicia encontró allí.

Para explicar la dificultad que en apariencia invalidaba una teoría como la de Yang y Mills para describir las interacciones mesón-nucleón conviene recordar antes que las relaciones de Heisenberg establecen una relación entre la (dispersión en) energía necesaria que se produzca una “excitación virtual” (como deben ser los portadores, que no son estados estacionarios) y el tiempo que puede “vivir” dicha excitación; como la velocidad a que se puede mover el portador es necesariamente menor que la velocidad límite relativista c, la distancia recorrida por una tal excitación virtual no puede ser arbitrariamente grande, y esto lleva directamente a una relación entre la masa m de los portadores de una interacción y su alcance espacial \approx \frac{\hbar}{c} \frac{1}{m}. Por supuesto, hay que leer todo lo anterior con gafas cuánticas, pero eso no resta validez al argumento; numéricamente para una masa de 100MeV/c2, el alcance resultante es del orden del tamaño del núcleo atómico, 10-14m. De hecho, era esa idea con la que Yukawa había predicho la masa de los mesones como portadores de las fuerza de corto alcance entre nucleones, predicción que se confirmó cuando se descubrieron los piones, los portadores de estas fuerzas, cuya masa resultó estar en ese rango: 135MeV/c2 para el pión neutro y 140MeV/c2 para los piones cargados.

Sin embargo —y esto fué lo que Pauli vió enseguida, según narrábamos en el post anterior—, una teoría como la que él había desarrollado en 1953 o como la de Yang y Mills de 1954 requería que los portadores fueran de masa nula, lo que implica un alcance infinito para la interacción. Esto entra en violento conflicto con las observaciones: el alcance de las interacciones fuertes es corto, del orden del tamaño núcleo atómico, que como mucho (en los núcleos pesados) es un orden de magnitud mayor que el “tamaño” de los nucleones individuales, 10-15m.

En el lenguaje actual, la exigencia de invariancia de tipo gauge conduce de manera ineluctable a que los bosones portadores de las correspondientes interacciones deben tener masa nula (lo que en la jerga se enuncia diciendo que el lagrangiano no puede contener términos de masa para los portadores, que romperían la invariancia gauge). En la única teoría gauge previamente existente y ya confirmada, la QED, los fotones son en efecto de masa nula y las interacciones son de largo alcance. En el electromagnetismo clásico, la dependencia en 1/r de los potenciales o en 1/r2 para las fuerzas  es un resultado “natural” que proviene del teorema de Gauss, pero en la teoría cuántica, esta dependencia está indisolublemente ligada con la masa nula del fotón.

Que los fotones sean de masa nula es un hecho experimental (comprobado con una altísima precisión), que también puede verse como una consecuencia de la invariancia gauge local. Pero en las interacciones nucleares, tanto débiles como fuertes, los portadores no podían ser de masa nula como los fotones; al contrario, deben tener masa y por lo tanto transportar interacciones de corto alcance. Esta era la dificultad más manifiesta.

Pero no la única. Había otra dificultad fundamental señalada por Landau en 1955, ésta de índole más teórica pero a la vez más radical. Conceptualmente, se trata de una heredera de una de las dificultades que (retrospectivamente) asociamos con el origen de la Mecánica Cuántica, a saber, lo que se dió en llamar la catástrofe ultravioleta [Para ser exactos, su identificación como dificultad data de Ehrenfest, en 1912 y  como tal dificultad no jugó papel en la propuesta de Planck, en contra de lo que se lee a veces, por eso me he referido a ella como una dificultad vista en retrospectivo].

La catástrofe ultravioleta clásica en la radiación del cuerpo negro tiene que ver con el carácter continuo de las posibles frecuencias de la radiación en el electromagnetismo clásico. La dificultad desaparece al introducir un elemento discreto inherente, el del cuanto de radiación: entonces las fluctuaciones de muy pequeña amplitud y muy alta frecuencia del campo, responsables de la catástrofe ultravioleta, simplemente no pueden ocurrir.

Lev Landau. Fuente: Wikipedia. Esta es la fotografía de Landau que figuraba en las cubiertas de mi baqueteada copia de la Theorie du champ, editada por Mir.

Lev Landau. Fuente: Wikipedia. Esta es la fotografía de Landau que figuraba en las guardas de mi apreciadísima  copia de la Theorie du champ, editada por Mir.

Lo que Landau señala es en cierto sentido una reencarnación de esta dificultad en la nueva teoría cuántica de campos. Consideremos la situación en la electrodinámica cuántica, donde nuestra intuición, formada en el electromagnetismo clásico, la hace más fácil de imaginar. Supongamos un electrón completamente aislado, que tiene una cierta carga eléctrica e0, que podemos llamar carga desnuda. Mientras ese electrón aislado sea todo lo que consideramos, todo lo que exista en el universo, y no haya nada más, podemos esperar que ésta sea la carga neta que veamos en el interior de una esfera de cualquier radio que encierre al electrón. Parece claro, ¿verdad? Pues no.

Lo anterior solamente se puede imaginar de manera consistente en el electromagnetismo clásico. En él no parece haber ninguna diferencia entre la carga “desnuda” y la carga “observable” del electrón. Pero la teoría cuántica de campos nos obliga a un nuevo reconocimiento bastante radical: pensar en un electrón aislado como “todo lo que hay”, es no solamente  ingenuo, sino inconsistente por completo. Realmente, en QFT son inevitables las fluctuaciones del vacío, que podemos imaginar en la QED como pares virtuales electrón-positrón, incansablemente apareciendo y desapareciendo. El vacío así adquiere las propiedades de un medio material y es polarizable: por hablar figuradamente, el electrón tiende a atraer a los positrones virtuales y a repeler a los electrones virtuales, cuyas energías pueden ser arbitrariamente altas: al considerar energías cada vez más grandes, los pares virtuales correspondientes existirán durante tiempos cada vez más pequeños.

Un excursus breve: entre los muchos crímenes de bautismo cometidos por los físicos, poniendo nombres directamente inadecuados a propiedades, teorías, etc. (el nombre Teoría de la Relatividad es un buen ejemplo de ello), el de partículas virtuales se lleva uno de los primeros premios. Si lo entendemos literalmente, ese término sugiere que se trata de partículas que en algún sentido no son reales. Pero el significado es completamente el contrario: se trata de objetos que son absolutamente reales pero que no son partículas. El lector ingenuo se preguntará: ¿y porque se las llama así, pues? Una buena pregunta, que habremos de discutir en otra ocasión.
Oponerse a la inercia de los nombres establecidos es iluso e imposible, por lo que en gran medida nos vemos abocados a seguir el empleo habitual, pero no debemos olvidar a Humpty Dumpty: estas palabras significan sólo lo que los físicos en este contexto queremos que signifiquen. Y ese significado es bastante diferente de lo que las palabras, in vitro,  parecerían sugerir. Si nos dejamos guiar por el sentido que la construcción partículas virtuales parece tener  para el lego, lo más probable es que entremos en un laberinto de dificultades completamente innecesarias en el que no podremos escuchar lo que la Física nos quiere decir. Fin del aviso.

En el vacío esperaríamos que las densidades de electrones y positrones virtuales sean iguales. Sin embargo, en presencia de una carga adicional “externa” como nuestro electrón, el vacío se polariza. Esto significa que en las cercanías del electrón original la densidad de positrones será mayor que la de electrones virtuales, que habrán tenido una tendencia a “desplazarse” alejándose de la carga, mientras que los positrones se habrán acercado. En consecuencia, hay un fenómeno de apantallamiento de la carga: la carga neta que se aprecie encerrada en una esfera dependerá del radio r de la esfera (o de la energía a la que estemos trabajando). Con este “argumento de mover las manos” parece claro que a cualquier distancia debemos esperar que la “carga efectiva” e(r) sea diferente de e0 y menor que ese valor.

No hay nada muy misterioso en ello. Lo importante es apreciar que en la teoría cuántica del campo electromagnético, la QED, la idea de un electrón desnudo completamente aislado del resto del Universo es una idealización exagerada. Si queremos ser “realistas” nos vemos abocados a pensar en el electrón real como rodeado de una nube de electrones y positrones virtuales, (cuyos efectos son bien reales!) que por la polarización del vacío tienden a separarse, acumulando carga positiva extra en las cercanías del electrón. Por ello, parece también de esperar que cuanto más grande tomemos la esfera, la carga efectiva del electrón sea menor, pues el volumen relevante a efectos de apantallar la carga es mayor. La cuestión ahora consistiría en saber precisamente “¿cuánto menor?”

Lo que Landau y Pomeranchuk hicieron fue traducir este bla-bla-bla a un cálculo completo efectuado en el formalismo de la QED, llevando sus aproximaciones más allá de los desarrollos perturbativos de orden bajo que tan buen resultado habían dado para los cálculos del efecto Lamb y para otros efectos. Y el resultado fue radical: si se iba hasta el final en esos cálculos, el resultado era que independientemente del valor inicial de la carga desnuda e0, para cualquier valor finito de r la carga efectiva e(r) resulta ser idénticamente nula. Un cálculo semejante se repitió para varias otras teorías cuánticas de campos, y en todos los casos se obtuvo el mismo resultado, que se denominó el problema de la “carga cero”. Landau y Pomeranchuk lo enuncian diciendo

We reach the conclusion that within the limits of formal electrodynamics a point interaction is equivalent, for any intensity whatever, to no interaction at all

Esta inconsistencia, que se manifiesta básicamente solo a muy altas energías, es desde el punto de vista conceptual un resultado aparentemente demoledor: viene a sugerir que la QED, la teoría que es capaz de predecir con precisión once cifras decimales en la razón giromagnética del electrón, es una teoría inconsistente. Landau, por su parte, no veía este resultado con malos ojos, y por ello sobre 1960 en la Unión Soviética se había impuesto la idea de que la teoría cuántica de campos no podía ser una teoría fundamental; a lo sumo sería algún tipo de teoría aproximada. Desmontada así la QED, la esperanza de poder formular en un marco análogo ninguna teoría de las interacciones nucleares ni siquiera se planteaba.

La unión de las dificultades indicadas, junto con el fracaso de los intentos de entender los detalles de las interacciones mesón-nucleón, fueron llevando al convencimiento, a primeros de los 60s, de que no parecía ser posible describir las interacciones fuertes mediante una teoría cuántica de campos análoga a la QED. E incluso, que encontrar una descripción correcta de las interacciones fuertes iba a ser un auténtico problema cuya solución no estaba a la vista ni mucho menos. Cito solamente tres ejemplos muy destacados: Dyson, que había trabajado en ese campo un par de años (sus recuerdos sobre esa etapa, extremadamente interesantes, pueden verse narrados por él mismo aquí y aquí) había afirmado que “la teoría correcta [de las interacciones fuertes] no se encontrará en los próximos cien años”. En esa misma época Feynman pensaba que las interacciones fuertes no podrían describirse mediante una teoría gauge, aunque veinte años después reconociera abiertamente (en esta entrevista) que estaba equivocado. Por su parte, Landau publica en 1960 una corta nota de tres páginas (uno de sus últimos artículos, antes del accidente que acabó con su vida científica) en la que expone la dificultad que antes hemos discutido y acaba con una frase lapidaria:

…. nos vemos llevados a la conclusión de que el método hamiltoniano para las interacciones fuertes está muerto, y debe ser enterrado, aunque eso sí, con merecidos honores.

Se entiende pues que inicialmente las ideas de construir teorías análogas a la de Yang-Mills para obtener modelos de las interacciones fuertes no tuvieran demasiado eco. Para los muy informados (o para quienes lo vemos con la ventaja que da una perspectiva de 50 años) esto no era de extrañar.

En paralelo temporal a estos desarrollos, en la década de los 1950s estaba teniendo lugar , un renacimiento en el interés por buscar una teoría de las interacciones débiles, veinte años después de la teoría de Fermi. En 1954 Julian Schwinger propone como tema de tesis doctoral a Sheldon Glashow explorar las interacciones débiles en el marco matemático de una teoría gauge, como la de Yang y Mills. Los bosones portadores de esta interacción serían los que ahora llamamos W±, que Schwinger propone en 1958. Desarrollando las ideas de su tesis, y convencido de que unificar el electromagnetismo con las interacciones débiles es el enfoque correcto, Glashow predice en 1960 que además debe haber un bosón portador neutro, el Z0. Se están dando los primeros pasos que conducirán a la actual teoría electrodébil.

En esa teoría subsistía la dificultad básica, común al intento original de Yang y Mills para las interacciones fuertes: la estructura gauge exigía que los bosones portadores fueran de masa nula. Pero los auténticos portadores de las interacciones débiles debían ser muy masivos, bastante más que los de las fuertes, para explicar el muy corto alcance de estas interacciones.

Por todo ello, a principios de los 1960 la esperanza de poder construir una teoría gauge de las interacciones fuertes o débiles parecía estar en el aire. Pero hubo quienes, a pesar de todo, depositaron su confianza en el sueño de que una tal teoría fuera posible. Así en 1961 Salam y Ward escriben (A. Salam and J. C. Ward, Nuovo Cimento 19, 165 (1961)):

Our basic postulate is that it should be possible to generate strong, weak and electromagnetic interaction terms (with all their correct symmetry properties and also with clues regarding their relative strengths) by making local gauge transformations on the kinetic–energy terms in the free Lagrangian for all particles.

En 1961, posiblemente una idea así era más whisful thinking que otra cosa. Pero tan sólo trece años más tarde, en 1974, y en contra de las previsiones de Dyson, de Feynman y de Landau, el panorama había cambiado completamente.

En 1974 el paradigma gauge para las interacciones nucleares, descrito de manera visionaria en la cita de Salam y Ward había quedado establecido, para los siguientes cuarenta años hasta hoy al menos. En esa fecha se habían completado los dos objetivos previos, y se había logrado un tercer objetivo, si cabe más ambicioso.

El primero: se tenía una teoría gauge de las interacciones fuertes, la llamada Cromodinámica Cuántica, acrónimo QCD, esencialmente única —y por tanto con una alternativa no ambigua frente a los experimentos: o era confirmada o era rechazada—.  Hasta ahora las observaciones la han confirmado y sigue siendo considerada la teoría de las interacciones fuertes.

El segundo: se había establecido una teoría gauge de las interacciones débiles, unificadas con las electromagnéticas en la llamada teoría electrodébil.

Y finalmente, el tercer ambicioso objetivo, ambas teorías se habían englobado en un modelo conjunto de las interacciones entre partículas, el actual modelo estandar, que en los siguientes 40 años sería confirmado con extraordinaria precisión y multitud de éxitos predictivos.

La pregunta obligada en este punto es: siendo las dificultades del calibre que antes hemos señalado, ¿cómo fue posible que el punto de vista cambiara de tal manera en poco más de una década? Naturalmente, este cambio no se dió por añadidura, sino solamente después de haberse introducido en el juego varios ingredientes totalmente nuevos, que en 1961 no estaban disponibles, pero que eran imprescindibles para solventar las dificultades previas. Son básicamente dos: el mecanismo de Higgs con su ruptura espontánea de la simetría por un lado, y la posibilidad de que una teoría gauge no abeliana fuera renormalizable y tuviera la propiedad conocida como libertad asintótica. Describiremos ambas ideas en el post siguiente al próximo. Pues antes deberemos detenernos en los desarrollos centrados en la aparición de la idea de los quarks en la década de los 1960s.

Este post, “Del átomo al Higgs VII: Dificultades iniciales de las teorías gauge entre 1954 y 1961” forma parte de una serie. Este enlace lleva al post sucesivo. Si quiere saltar directamente a otro post de la serie, puede usar los enlaces directos a cada entrada.

O Átomos y vacío: donde Demócrito conoce a Higgs
I Los átomos de la materia ordinaria
II Cuantificación y la estabilidad del Átomo
III Espín, Bosones y Fermiones
IV La electrodinámica cuántica y los primeros ejemplos de la teoría cuántica de campos
V El nacimiento de la idea de las cuatro interacciones fundamentales
VI El Zoo de partículas y los primeros intentos de describir las interacciones fuerte y débil
Interludio: Los Nobel en la historia del átomo al Higgs
VII Dificultades iniciales de las teorías gauge entre 1954 y 1961
VIII Los quarks, desde su propuesta hasta su “descubrimiento” (1961 a 1974)
IX El campo de Higgs y el mecanismo de Brout-Englert-Higgs
X La libertad asintótica y la Cromodinámica Cuántica
Interludio: ¿Pero qué hay realmente en un protón?
Interludio. Calculando la masa del protón
XI El actual modelo estandar a vista de pájaro
XII 1898-1995, un siglo descubriendo partículas …
XIII Búsqueda y hallazgo del bosón de Higgs
Del átomo al Higgs: Para saber más
.
.
Anuncios
Esta entrada fue publicada en Uncategorized y etiquetada , , , , , , , , , , , , , , , , . Guarda el enlace permanente.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s