Hace unos meses conocíamos la noticia de la demostración de la conjetura débil de Goldbach por parte de Harald Andrés Helfgott, matemático peruano especialista en teoría de números que en la actualidad es investigador del Centre National de la Recherche Scientifique (CNRS) de Francia. Aquí tenéis su CV en francés y aquí una versión más breve en inglés (ambos en formato pdf).
Poco después me puse en contacto con él para sugerirle que colaborara con Gaussianos con un artículo en el que nos contara las líneas generales de esta demostración, y es de agradecer la predisposición para ello que mostró desde el primer momento.
Lo que acordamos fue lo siguiente: él publicaría el artículo en inglés en su blog (podéis acceder a él haciendo click en este enlace) y después lo traduciríamos al español para su publicación en Gaussianos. Y así ha sido. Señoras y señores, en los próximos párrafos podrán leer las claves de la demostración de la conocida como conjetura débil de Goldbach.
La conjetura débil de Goldbach
Introducción
Leonhard Euler, uno de los matemáticos más importantes del siglo XVIII y de todos los tiempos, y su amigo, el amateur y polímata Christian Goldbach, tuvieron una regular y abundante correspondencia. Goldbach hizo una conjetura acerca de los números primos, y Euler rápidamente la redujo a la conjetura siguiente, que, según dijo, Goldbach ya le había expuesto:
Todo entero positivo puede expresarse como suma de, como mucho, tres números primos.
Nosotros diríamos ahora «todo entero positivo mayor que «, ya que ya no consideramos al
como número primo. Por otra parte, actualmente la conjetura se divide en dos:
- La conjetura débil (o ternaria) de Goldbach, que dice que todo entero impar mayor que
puede escribirse como suma de tres números primos, y
- La conjetura fuerte (o binaria) de Goldbach, que dice que todo entero par mayor que
puede expresarse como suma de dos números primos.
Como sus nombres indican, la conjetura fuerte implica a la débil (fácilmente: reste a su número impar y después exprese
como suma de dos primos).
Se puede consultar Dickson, istory of the theory of numbers, Vol. I., Ch. XVIII, para conocer la historia temprana de la conjetura. En resumen, parece que Waring volvió a proponer por su cuenta la conjetura débil a finales del siglo XVIII, y que en el siglo XIX se hizo algo de trabajo computacional (comprobando la conjetura para los números enteros hasta a mano) pero poco progreso de verdad.
La conjetura fuerte sigue fuera de alcance. Hace unas semanas – mi prepublicación apareció el 13 de mayo de 2013 – probé la conjetura débil de Goldbach.
La prueba se basa en los avances logrados a principios del siglo XX por Hardy, Littlewood y Vinogradov. En 1937, Vinogradov probó que la conjetura es cierta para todos los números impares mayores que alguna constante . (Hardy y Littlewood habían mostrado lo mismo bajo la suposición de que la Hipótesis generalizada de Riemann fuera cierta; hablaremos de esto más adelante.) Desde ese entonces, la constante
ha sido especificada y gradualmente mejorada, pero el mejor valor (esto es, el más pequeño) de
del que se disponía era
(Liu-Wang), lo cual era de lejos demasiado grande. Incluso
sería demasiado: como
es más grande que el producto del número estimado de partículas subatómicas del universo por el número de segundos desde el Big Bang, no había ninguna esperanza de comprobar cada caso hasta
por ordenador (aun asumiendo que uno fuera un dictador alienígena usando el universo entero como una computadora muy altamente paralela).
Yo reduje a
(y podría bajarlo más si fuera necesario). D. Platt y yo habíamos comprobado la conjetura para todos los números impares hasta
por ordenador (y podríamos haber llegado más lejos), así que éste fue el final de la historia.
¿Cuáles son los elementos de la demostración? Demos primero un paso atrás y echemos una mirada a la estructura general del «método del círculo», introducido por Hardy y Littlewood.
El método del círculo: análisis de Fourier en los enteros
El análisis de Fourier es algo que usamos cada vez que sintonizamos una radio: hay una señal, y la descomponemos en sus componentes en diferentes frecuencias. En términos matemáticos: se nos da una función (esto es, una función de una sola variable real; en el caso de la radio la variable es el tiempo) y definimos la transformada de Fourier
como
, donde escribimos
por
. Entonces, como se aprende en cualquier curso de análisis de Fourier,
, siempre que
decaiga suficientemente rápido y se comporte bien. (Ésta es la «fórmula de inversión de Fourier».)
En otras palabras, ha sido descompuesta como una suma de funciones exponenciales (complejas), con la función exponencial(compleja)
presente con intensidad
. (Esto es equivalente a una descomposición en ondas sinusoidales
y
, ya que
). Volviendo al ejemplo de la radio:
es grande cuando
está cerca de la frecuencia de alguna estación de radio, y pequeño en otro caso. (Lo que la radio recibe es una superposición
de lo que transmiten todas las estaciones; el trabajo del receptor de radio consiste precisamente en descifrar la contribución de las frecuencias
alrededor de un
dado.)
Podemos hacer lo mismo si es una función que va de los enteros
a
. De hecho, las cosas son ahora más simples – se llega a definir
como una suma en vez de como una integral:
. Algo interesante aquí es que
no cambia en absoluto si sumamos 1, o cualquier otro entero
, a
. Esto es así porque, para
entero,
(Gracias de nuevo, Euler.) Por tanto, podemos restringir al intervalo
– o, de forma más abstracta, podemos pensar en
como un elemento del cociente
.
Topológicamente, es un círculo – lo cual es lo mismo que decir que, como no importa si sumamos o restamos 1 a nuestra frecuencia, podríamos también hacer que la aguja del dial de nuestra radio recorra un círculo marcado con números de 0 hasta 1, en vez de
que se deslice en (un segmento de) la recta real (como en la radio sobre mi mesa). De allí viene el nombre de método del círculo.
La descomposición de ahora se ve como sigue:
, a condición de que
decaiga suficientemente rápido.
¿Por qué nos importa todo esto? La transformada de Fourier es útil inmediatamente si estamos trabajando en problemas aditivos, como las conjeturas de Goldbach. La razón detrás de esto es que la transformada de una convolución es igual al producto de las transformadas:
Recordemos que la convolución (aditiva) de está definida por:
Podemos ver entonces que puede ser distinto de cero sólo si
puede ser escrito como
para algunos
tales que
y
sean distintos de cero. De forma similar,
puede ser distinto de cero sólo si
puede escribirse como
para algunos
y
tales que
y
sean todos distintos de cero. Ello sugiere que, para estudiar la conjetura ternaria de Goldbach, definamos
de forma que tomen valores distintos de cero sólo en los primos.
Hardy y Littlewood definieron para
compuesto (o cero o negativo) y
para
primo (donde
es un parámetro que será fijado más adelante). Aquí el factor
está para proporcionar «decaimiento rápido», por lo que todo converge; como veremos más adelante, la elección de Hardy y Littlewodd de
(en vez de alguna otra función de decaimiento rápido) es de hecho muy inteligente, aunque no la mejor posible. El término
aparece por razones técnicas (básicamente, resulta que tiene sentido ponderar un primo
por
porque aproximadamente uno de cada
enteros alrededor de
es primo).
Vemos que si y sólo si
puede ser escrito como la suma de tres primos. Nuestra tarea es, entonces, mostrar que
(es decir,
) es distinto de cero para todo
mayor que una constante. Como la transformada de una convolución es igual al producto de las transformadas,
Nuestro trabajo es por lo tanto mostrar que la integral
es distinta de cero.
Resulta que es particularmente grande cuando
está cerca de un racional con denominador pequeño; es como si hubiera realmente estaciones de radio transmitiendo las frecuencias (de denominador pequeño) marcadas en el dial dibujado arriba – cuando la aguja del dial está cerca de una de ellas, hay una señal fuerte y clara (i.e., la intensidad
es grande), y cuando estamos lejos de todas ellas, podemos escuchar sólo un leve zumbido. Esto sugiere la siguiente estrategia: calcular
para todo
dentro de arcos pequeños alrededor de los racionales con denominadores pequeños (los arcos mayores – llamados así porque dan una mayor contribución, a pesar de ser pequeños); acotar
para
fuera de los arcos mayores (todo lo que hay fuera de los arcos mayores se denomina arcos menores); por último, mostrar que la contribución de los arcos menores a la integral es menor en valor absoluto que la contribución de los arcos mayores, forzando así que la integral
sea distinta de cero.
Es a esta estrategia general a la que se llama el método del círculo. Hardy y Littlewood la introdujeron para tratar una amplia variedad de problemas aditivos; por ejemplo, fue también parte de su enfoque sobre el problema de Waring, que trata de enteros que son suma de potencias -ésimas de enteros. El método fue desarrollado plenamente por Vinogradov, quien fue el primero en dar buenas cotas incondicionales para
cuando
está en los arcos menores (un logro considerado muy notable en su tiempo). El método del círculo es también mi estrategia general: lo que he hecho es dar estimaciones mucho mejores para los arcos mayores y menores que las que teníamos previamente, para
,
y
elegidas con mucho cuidado.
(Incidentalmente: si comenzamos a tratar la conjetura binaria, o fuerte, de Goldbach con el método del círculo nos topamos pronto con un obstáculo mayúsculo: el «ruido» procedente de los arcos menores abruma la contribución de los arcos mayores. Ver la exposición de este problema en el post «Heuristic limitations of the circle method» de Terry Tao (20 de mayo de 2012).)
Funciones L de Dirichlet y sus ceros
Antes de que podamos comenzar a trabajar en los arcos mayores, necesitamos hablar sobre las funciones . Primero está la función zeta,
, estudiada para
complejo por Riemann, cuyo nombre ahora lleva. Está dada por
cuando la parte real de
es mayor que 1. Para
, la serie diverge, pero la función puede definirse (de forma única) por continuación analítica (y esto puede hacerse explícitamente usando, por ejemplo, Euler-MacLaurin, como en Davenport, «Multiplicative Number Theory», segunda edición, pág. 32), con un polo en
.
Análogamente, están las funciones de Dirichlet, definidas por
para , y por continuación analítica para
. Aquí
es cualquier carácter de Dirichlet; para cada
dado,
es una función de
. Un carácter de Dirichlet
(de módulo
) es una función
de período
(esto es,
para todo
), con las propiedades adicionales de que es multiplicativa (
para
cualesquiera) y que
cuando
y
no son coprimos. (La forma sofisticada de decir todo esto es que
es un carácter de
en
.) Los caracteres y las funciones
de Dirichlet fueron introducidas por Dirichlet para estudiar los primos en progresiones aritméticas.
Un cero de una función es un
tal que
. Un cero no trivial de
, o de
, es un cero de
, o de
, tal que
. (Los otros ceros son llamados triviales porque es fácil decir dónde están (a saber, en ciertos enteros no positivos).) La hipótesis de Riemann asevera que todos los ceros no triviales de la función zeta de Riemann «yacen en la recta crítica», lo cual significa que
. La Hipótesis generalizada de Riemann para funciones
de Dirichlet dice que, para todo carácter de Dirichlet
, todo cero no trivial de
satisface
.
Como tanto la Hipótesis de Riemann (HR) como la Hipótesis generalizada de Riemann (HGR) siguen sin ser demostradas, cualquier resultado probado usando una de ellas será condicional; ahora bien, nosotros queremos probar resultados incondicionales. Lo que de hecho puede ser demostrado, y utilizado, son resultados parciales en la dirección de la HGR. Tales resultados son de dos tipos:
- Regiones libres de ceros. Desde finales del siglo XIX (de la Vallée-Poussin) sabemos que hay regiones con forma de reloj de arena (más precisamente, de la forma
, donde
es una constante y donde escribimos
) fuera de las cuales no pueden yacer ceros no triviales.
- Verificaciones finitas de HGR. Es posible (usando un ordenador) probar pedazos finitos y no muy grandes de la HGR, en el sentido de verificar que todos los ceros
no triviales de una función
(
dado) con parte imaginaria
menor que alguna constante
yacen en la recta crítica
.
La mayor parte de los trabajos hasta la fecha sigue la primera alternativa. Yo elegí la segunda, y esto tuvo consecuencias para la manera en la que definí los arcos mayores y menores: conseguí resultados muy precisos en los arcos mayores, pero tuve que definirlos de tal manera que fueran pocos y muy estrechos; si no, el método no hubiera funcionado. Esto significó que los métodos de arco menor tenían que ser particularmente potentes, ya que una parte del círculo particularmente grande quedó para ser tratada con ellos.
Vamos a ver más detenidamente cómo se puede lidiar con los arcos mayores usando resultados parciales en camino hacia HGR y, en particular, verificaciones finitas de HGR.
Estimaciones en los arcos mayores
Recordemos que queremos calcular sumas del tipo , donde
es algo como
para
primo y
para
compuesto. Vamos a modificar esto sólo un poco – de hecho calcularemos
donde
es la función de Mangoldt:
si
es de la forma
, con
, y
de lo contrario. (El uso de
en vez de
es sólo una concesión a la tradición, como lo es el uso de la letra
(de «suma»). Por otra parte, el uso de
en lugar de simplemente
simplifica las cosas cuando hay que trabajar con las llamadas fórmulas explícitas, que veremos enseguida.) Aquí
es alguna función de decaimiento rápido; puede ser
, como en el trabajo de Hardy y Littlewood, o (como en mi trabajo) alguna otra función. (Podría incluso ser el «truncamiento brutal»
, igual a
cuando
y a
de lo contrario; esto sería bueno para los arcos menores, pero, como veremos, resulta ser una mala idea cuando se tratan los arcos mayores.)
Asumamos que está en un arco mayor, es decir, que podemos escribir
de la forma
para algún
(
pequeño) y algún
(con
pequeño). Podemos expresar
como una combinación lineal (esto es, una suma de múltiplos) de términos de la forma
, donde
y recorre los caracteres de Dirichlet de módulo
.
¿Por qué son las sumas mejores que las sumas
? El argumento se ha convertido en
, donde antes era
. Aquí
es pequeño – más pequeño que una constante, en nuestro tratamiento. En otras palabras,
se moverá alrededor del círculo un número acotado de veces a medida que
vaya de
hasta, digamos,
(para cuyo entonces
es ya muy pequeño). Esto hace que la suma
sea mucho más fácil de calcular.
Es un hecho estándar que podemos expresar mediante una fórmula explícita (sí, la frase tiene un significado técnico, como «Jugendtraum»):
Aquí el término entre corchetes aparece sólo para . En la suma,
recorre todos los ceros no triviales de
, y
es la transformada de Mellin de
:
Logramos nuestro objetivo si llegamos a demostrar que la suma es pequeña.
La cuestión es ésta – si comprobamos la HGR hasta parte imaginaria , entonces sabemos que todo
con
satisface
, y por lo tanto
. En otras palabras,
es entonces muy pequeño (comparado con
). Sin embargo, para cualquier
cuya parte imaginaria tenga valor absoluto mayor que
no sabemos nada sobre su parte real aparte de que
. (De acuerdo, podríamos usar una región libre de ceros, pero las regiones libres de ceros conocidas son notoriamente débiles para
grande – es decir, nos servirían de poco en la práctica.) Por lo tanto, nuestra única opción es asegurarnos de que
sea pequeña cuando
.
Esto, claro está, tendría que ser cierto para muy pequeño (incluyendo
) y para
no tan pequeño (
entre
y una constante). Si se juega con el método de la fase estacionaria, se consigue ver que
se comporta como
para
muy pequeño (aquí
es la transformada de Mellin de
) y como
para
no tan pequeño (donde
). Por tanto, estamos en un dilema clásico, a menudo llamado «principio de incertidumbre» porque es el hecho matemático subyacente al principio físico del mismo nombre: no se puede tener una función
que decrezca muy rápidamente y cuya transformada de Fourier (o, en este caso, su transformada de Mellin) también decaiga muy rápidamente.
¿Qué significa aquí «muy rápidamente»? Significa «más rápido que cualquier exponencial «. Por tanto, la elección
de Hardy y Littlewood parecería ser esencialmente óptima.
¡No tan deprisa! Lo que podemos hacer es elegir de tal manera
decrezca exponencialmente (con una constante
un poco peor que antes) y que
decrezca más rápido que exponencialmente. Esto es lo crucial, ya que
(y no tanto
en sí) corre el riesgo de ser bastante pequeño.
Una elección de que obecede a esta descripción es la función gaussiana
. La transformada de Mellin
es entonces una función cilíndrica parabólica, con valores imaginarios para uno de sus parámetros. Las funciones cilíndricas parabólicas parecen ser muy apreciadas y estudiadas en el mundo aplicado – pero más que nada para valores reales del citado parámetro. Hay algunas expansiones asintóticas de
en la literatura para parámetros generales (notablemente por F. W. J. Olver), pero ninguna que sea suficientemente explícita para mis propósitos. Por tanto, tenía que proporcionar estimaciones totalmente explícitas yo mismo, usando el método del punto de silla. Esto me llevó un buen rato, pero los resultados seguramente serán de aplicación general – hola, ingenieros – y también es de esperar que la función Gaussiana se vuelva un poco más popular en trabajos explícitos en teoría de números.
A propósito, estas estimaciones de funciones cilíndricas parabólicas nos permiten tomar no sólo , sino también, más generalmente,
, donde
es cualquier función de banda limitada, lo que significa, en este contexto, cualquier función
cuya transformada de Mellin restringida al eje
tenga soporte compacto. Deseamos optimizar la elección de
– hablaremos de ello más adelante.
Los arcos menores
¿Cómo acotamos cuando
no está cerca de ningún racional
de denominador pequeño? Que esto sea posible fue el gran logro de Vinogradov. El progreso desde entonces ha sido gradual. Doy mi propio enfoque al asunto en mi artículo «Arcos menores». Déjenme comentar algunas de las ideas detrás de los avances allí contenidos.
La demostración de Vinogradov fue muy simplificada en los 70 (del siglo XX) por Vaughan, quien introdujo la identidad que ahora lleva su nombre. Básicamente, la identidad de Vaughan es un gambito: otorga una gran flexibilidad, pero a un precio – aquí, un precio de dos logaritmos, en lugar de, digamos, dos peones. El problema es que, si queremos alcanzar nuestro objetivo, no podemos permitirnos el lujo de perder logaritmos. La única opción es recuperar esos logaritmos, encontrando cancelaciones en las diferentes sumas que surgen de la identidad de Vaughan. Esto se tiene que hacer, por cierto, sin usar funciones , puesto que ya no podemos asumir que
sea pequeño.
He aquí otro tema de esta parte de la prueba. Todo tiene una aproximación
; el hecho de que
esté en los arcos menores nos dice que
no es muy pequeño. Estamos buscando cotas que decrezcan a medida que
crece; la cota que yo obtengo es proporcional a
. ¿Cuál es el efecto de
?
Algo de lo que me di cuenta pronto fue que, si no es muy pequeño, puede de hecho ser utilizado en nuestro beneficio. Una razón es que hay términos de la forma
, y la tranformada de Fourier de funciones suaves decae conforme el argumento crece. Hay otras razones, empero. Algo que podemos usar es lo siguiente: por un resultado básico de aproximación Diofántica, todo
tiene muy buenas aproximaciones por racionales con denominador no demasiado grande. Si
no es muy pequeño, entonces la aproximación
es buena, pero no muy buena; por lo tanto, debe haber otra mejor aproximación $latex \alpha \sim
a^\prime/q^\prime$ con no demasiado grande (lo que significa «considerablemente más pequeño que
«). Podemos ir y volver entre las aproximaciones
y
, dependiendo de cuál es más útil en el momento. Ello resulta ser mejor que usar una sola aproximación
, por muy buena que ésta sea.
Otra manera en la que se consigue usar un grande es esparciendo las entradas en una gran criba. La gran criba puede ser vista como una forma aproximada de la identidad de Plancherel, reformulada como una desigualdad; mientras la identidad de Plancherel nos dice que la norma
(norma
) de la tranformada de Fourier
de una función
definida en los enteros (por ejemplo, lo mismo vale para los reales u otros grupos) es igual a la norma
de la misma función
, la gran criba nos dice que el total de
para una muestra bien espaciada de puntos
está acotada por (un múltiplo de)
. Ahora bien, en nuestro caso, los puntos
son múltiplos de nuestro ángulo
. Si
, el espaciado entre los puntos
es
, lo cual es bueno – pero puede ser que tengamos que aplicar la gran criba varias veces, ya que tenemos que aplicarla de nuevo para cada tanda de
puntos. Sin embargo, si
y
no es demasiado pequeño, podemos rodear el círculo varias veces y confiar en
en vez de en
para darnos el espaciado. Sí,
(e incluso
) es más pequeño que
, pero el efecto de esto está más que compensado por el hecho de que tenemos que recurrir a la gran criba muchas menos veces (quizás solamente una vez).
Lo que es más, esta manera de esparcir los ángulos puede ser combinada con otra manera más tradicional de esparcirlos (lema de Montgomery; ver «Topics in multiplicative number theory» de Montgomery, o la exposición en Iwaniec-Kowalski, sección 7.4) con el fin de aprovechar el hecho de que estamos tratando con sumas donde la variable recorre los primos .
Conclusión
Hemos estado hablando acerca de acotar para
dentro de los arcos menores, pero lo que queremos hacer realmente es acotar la integral
. Una forma fácil – y tradicional – de hacer esto es usar la desigualdad trivial
Desafortunadamente, así perderíamos un factor de un logaritmo.
Como nuestras cotas para ,
, están dadas en términos de
, tiene sentido combinarlas con estimaciones para integrales del tipo
, donde
es una unión de arcos alrededor de racionales con denominador más grande que una constante pero menor que
. ¿Cómo estimamos estas integrales? Esta pregunta está muy relacionada con otra que entra dentro del marco de la gran criba: ¿qué cotas se pueden conseguir para
,
, donde
es de tamaño moderado, si es que estamos trabajando con una sucesión con soporte en los primos?
Había una respuesta en la literatura (basada en el lema de Montgomery; el enlace con el método del círculo ya fue observado por Heath-Brown) pero era peor que la cota óptima por un factor de al menos (o de hecho más). Había una estimación más reciente para la gran criba debida a Ramaré, pero no se había hecho totalmente explícita. Tuve que hacerla explícita, y luego adapté el nuevo resultado sobre la gran criba a la tarea de estimar la integral sobre
. Como era de esperar, el factor
(o realmente un poco más) desapareció.
Queda por comparar el término principal con el error. Resulta que tenemos cierto margen para elegir lo que será el término principal, ya que depende de los pesos que utilicemos. El término principal es proporcional a
donde y
son los dos pesos con los que escogemos trabajar,
es el número impar que queremos expresar como suma de tres primos y
es de nuevo un parámetro de nuestra elección. En comparación, el error es proporcional a
. Así, tenemos un problema de optimización («maximizar el tamaño de la doble integral dividida por
«). Lo mejor es elegir un peso
simétrico o cercano a ser simétrico (
), asegurándonos, por otra parte, que
para
. Esto no es demasiado difícil de conseguir aun bajo la restricción de que
sea de la forma
, donde
es de banda limitada.
¿Qué pasa con ? La solución del problema de optimización nos dice que debe ser de soporte pequeño, o por lo menos concentrado cerca del origen. Aparte de eso – hay, por decirlo así, un problema político:
, a diferencia de
, se usa tanto en los arcos mayores como en los menores; los arcos mayores quieren de verdad que sea de la forma
o
, mientras los arcos menores preferirían algo más simple, como
o como
, donde
es la convolución multiplicativa (o convolución de Mellin):
(Aquí es precisamente el peso usado en el articulo de Tao sobre los cinco primos o en mi propio artículo sobre los arcos menores.)
La solución es simple: definamos , donde
es una constante grande,
y
. Para
y
esencialmente arbitrarias, si se sabe cómo calcular (o estimar)
para algunos
, y se sabe estimar
para todos los otros
, entonces se sabe cómo estimar
para todo
. (La prueba sale en un par de líneas; se escribe qué es
en detalle y se cambia el orden de la suma y la integral. En el proceso también se aclara que ayuda si
y
son para
cercano a
.)
La moraleja de esta historia es que diferentes problemas, y diferentes partes del mismo problema, piden diferentes pesos . Al menos en el contexto de sumas exponenciales, resulta haber un simple truco para combinarlas, como acabamos de ver.
Algunos comentarios finales sobre computación
Una demostración analítica normalmente da una prueba válida para todo mayor que una constante
. La razón es simple: digamos que queremos mostrar que una cantidad es positiva. Generalmente, después de bastante trabajo analítico, se llega a probar que la cantidad es de la forma
, donde el valor absoluto de este error es menor que, digamos,
(para dar un ejemplo simple). Esto ciertamente muestra que la cantidad es positiva – a condición de que
. La tarea, entonces, es refinar la demostración hasta que la constante
sea suficientemente pequeña para que todos los casos en los que
puedan ser comprobados a mano (literalmente a mano o con un ordenador). Esto fue, en gran parte, mi trabajo: comprobar la conjetura hasta
(y de hecho hasta
) fue, en comparación, una tarea secundaria – como veremos, no era siquiera el principal esfuerzo computacional.
Primero, permítanme decir algunas palabras más en general sobre resultados analíticos. Hay resultados del tipo «la proposición es cierta para todo mayor que una constante
, pero esta demostración no nos dice nada sobre
aparte de que existe». Esto es llamado una «estimación inefectiva«; muchas demostraciones de los resultados de Vinogradov en libros de texto son de este tipo. (La razón detrás de esto es la posibile existencia de los llamados «ceros de Siegel».) Un resultado puede decir también «la sentencia es cierta para todo
, y en principio se debería poder determinar algún valor de
usando las ideas de la prueba, pero el autor preferiría irse a tomar un café». Ésta es una proposición
efectiva no explícita; la versión definitiva de Vinogradov de su propio resultado fue de este tipo (como lo son muchos otros resultados en matemáticas, incluyendo algunos de mi propio pasado). Si se da un valor explícito de , entonces el resultado se denomina (¡sorpresa!) «explícito». Queda la cuarta etapa: conseguir que
sea razonable, esto es, suficientemente pequeña como para que el caso
pueda ser comprobado a mano. Estuvo claro desde el principio que, en el caso de la conjetura ternaria de Goldbach, «razonable» significaba aproximadamente
(aunque las verificaciones existentes llegaban a bastante menos que
).
Dije antes que D. Platt y yo comprobamos la conjetura para todos los impares hasta . He aquí cómo procedimos. Ya se sabía (gracias a un esfuerzo de gran envergadura de parte de Oliveira e Silva, Herzog y Pardi) que la conjetura binaria de Goldbach es cierta hasta
– esto es, todo número hasta
es suma de dos números primos. Dado esto, todo lo que teníamos que hacer era construir una «escalera de primos», esto es, una lista de primos desde
hasta
tal que la diferencia entre cualesquiera dos primos consecutivos de la lista fuera a lo más
. Por tanto, si alguien le da a uno un entero impar
hasta $latex 8.8 \cdot
10^{30}$, se sabe que hay un primo en la lista tal que
es positivo y a lo más
. Por hipótesis, podemos escribir
para algunos primos
, y por tanto
.
Construir esta escalera no nos llevó mucho tiempo. (De hecho, conseguir una escalera hasta es probablemente algo que Vd. pueda hacer en su ordenador personal en unas pocas semanas – aunque almacenarla es otro asunto.) La tarea se hace en «aritmética entera», y comprobamos la primalidad de los números en la escalera de manera determinista (restringiéndonos a primos para los cuales hay un algoritmo rápido de comprobación de primalidad), así que no hay que preocuparse.
El cálculo más grande consiste en verificar que, para toda función de conductor
hasta sobre
(o dos veces esto para
par), todos los ceros de la función
con parte imaginaria acotada por
yacen sobre la línea crítica. Esto fue por completo obra de Platt; mi única contribución fue ir a buscar tiempo de ordenador por muchas partes (ver la sección de agradecimientos del artículo «Major arcs»). De hecho, Platt llegó hasta conductor
(o dos veces esto para
par); ya había llegado hasta el conductor
en su tesis. La verificación llevó, en total, unas
horas de núcleo (esto es, el número total de núcleos (cores) de procesador usados por el número de horas que corrieron es igual a
; hoy en día, un procesador de primera línea – como los de la máquina en MesoPSL – normalmente tiene ocho núcleos). Al final, como decía, usé solamente
(o el doble de esto para
par), por lo que el número de horas necesarias fue de hecho unas
; como me hubiera bastado con aproximadamente
, podría decir que, en retrospectiva, se necesitaba sólo unas
horas de núcleo. Los ordenadores y yo fuimos cavando por lados opuestos de la montaña, y nos encontramos en el centro. El hecho de que los ordenadores trabajaran más de lo necesario no es nada que lamentar: el cálculo hecho es de uso general, y por tanto es mucho mejor que no esté «hecho a la talla» de mis necesidades; por otra parte, con demostraciones de esta longitud, lo mejor es «construir como un romano», es decir, calcular de más por si uno (¡no el ordenador!) ha cometido algún pequeño error en algún sitio. (¿Por que creen que esas paredes eran tan gruesas?)
Comprobar los ceros de la función computacionalmente es algo tan viejo como Riemann (quien lo hizo a mano); es también una de las cosas que se intentaron en computadoras electrónicas ya en sus primeros días (Turing tenía un artículo sobre eso). Una de las principales cuestiones con las que hay que tener cuidado surge cuandoquiera se manipulen números reales: hablando honestamente, un ordenador no puede almacenar
; más aún, si bien un ordenador puede manejar números racionales, realmente se siente cómodo sólo cuando maneja aquellos racionales cuyos denominadores son potencias de dos. Por tanto, en realidad no se puede decir: «ordenador, dame el seno de este número» y esperar un resultado preciso. Lo que se debería hacer, si realmente se quiere probar algo (¡como en este caso!) es decir: «ordenador, te estoy dando un intervalo
; dame un intervalo
, preferiblemente muy pequeño, tal que
«. Esto es llamado «aritmética de intervalos»; es realmente la forma más sencilla de hacer cálculos en coma flotante de manera rigurosa.
Ahora, los procesadores no hacen esto de forma nativa, y si se hace puramente con software se retrasan las cosas por un factor de más o menos . Afortunadamente, hay maneras de hacer esto a medias con hardware y a medias con software. Platt tiene su propia biblioteca de rutinas, pero hay otras online (por ejemplo, PROFIL/BIAS).
(Oh, a propósito, no usen la función seno en un procesador Intel si quieren que el resultado sea correcto hasta el último bit. ¿En qué habrán estado pensando? Use la biblioteca crlibm en su lugar.)
Por último, hubo varios cálculos bastante menores que hice yo mismo; los encontrarán mencionados en mis artículos. Un cálculo habitual fue una versión rigurosa de una «demostración por gráfica» («el máximo de una función es claramente menor que
porque gnuplot me lo dijo»). Encontrará algoritmos para esto en cualquier libro de texto sobre «computación validada» – básicamente, es suficiente combinar el método de la bisección con aritmética de intervalos.
Finalmente, déjenme indicar que hay una desigualdad elemental en el artículo «Minor arcs» (viz., (4.24) en la demostración del Lema 4.2) que fue probada en parte por un humano (yo) y en parte por un programa de eliminación de cuantificadores. En otras palabras, ya existen programas de ordenador (en este caso, QEPCAD) que pueden probar cosas útiles. Ahora bien, no tengo dudas de que la misma desigualdad puede ser probada puramente mediante el uso de seres humanos, pero es bonito saber que nuestros amigos los ordenadores pueden (pretender) hacer algo más que masticar números…
Esta es mi tercera aportación a la Edición 4.1231056 del Carnaval de Matemáticas, cuyo anfitrión es nuestro amigo José Manuel López Nicolás en su blog Scientia.
¿Te ha gustado la entrada? Puedes invitarme a un café, Gauss te lo agradecerá 😉
Increíble, este hombre derrocha conocimiento en cada una de las palabras que escribe. A pesar de la densidad de los asuntos que trata el artículo, está todo explicado de forma muy pedagógica, cosa que se agradece.
Información Bitacoras.com
Valora en Bitacoras.com: No hay resumen disponible para esta anotación
Genial…
Esto es Matemática de verdad. Lo que en algunos libros se conocía, cuando empecé Mates Puras antes de cambiarme a Ing. en Computación, como «Higher Math» Aquí uno se da cuenta de que hacer matemática no tiene nada que ver con entender los pequeños rudimentos que hay que cubrir en una carreera como ingeniería… o simplemente entender de notaciones símbolos o saber razonar, la matemática es toda un área de conocimiento, la teoría de números una de sus ramas, y este tema apenas uno de tantos… Qué agradable cuando Harald dice «aquí no consideramos 1 como primo», pues en una… Lee más »
Caray… Gracias Gasussianos por conseguir ésta contribución…
Amigo Diamond, hay alguna forma de colocar un avatar al perfil antes de enviar el comentario?
Tuve el placer de conocerlo personalmente cuando dictó una charla magistral en la Universidad Nacional Mayor de San Marcos en Perú. Es necesario mencionar que su disposición a quedarse a conversar con algunos estudiantes de pregrado de matemáticas me llamó la atención, se dió tiempo hasta de tomarse fotos con algunos de ellos. Cabe resaltar que Harald tiene una formación muy precoz en matemáticas, tan así que asistía a escuchar clases que su padre, otro magnífico matemático, diera hace muchos años en la universidad antes mencionada. Asimismo, su participación en las clases para estudiantes olímpicos en matemática. Actualmente, viene apoyando… Lee más »
Perdón arruinarles pero hay un vídeo en donde explica eso también, igual lo dejo por si alguien se interesa http://www.youtube.com/watch?v=MwPy4Zo7TeA empieza por el minuto 21
¡Vaya nivelazo! A ver si tengo tiempo de leerlo más despacio porque parece que no es imposible de seguir, al menos una parte.
Julio, no arruinas nada. El vídeo es de una conferencia sobre el tema de Harald Helfgott y este artículo lo ha escrito el propio Helfgott.
golvano, sí, hay que leerla despacio y con calma, poco a poco, para no perderse ni un detalle :).
grandisimas mentes perdidos en problemas absurdos que no sirven para nada 😀
mejor si se buscaran o intentara estudiar ecuaciones de fisica de fluidos o cosas utiles de fisica quimica o matematicas 🙂 para mejorar el mundo
José. Las ciencias están llenas de cuestiones que desde fuera y sin el conocimiento pertinente pueden parecer «absurdas», «que no sirven para nada». La ciencia ha dado ejemplos de sobra de problemas que parecían inocuos y sin embargo resultaron ser de utilidad. La importancia de resolver problemas no radica solo en la utilidad que tengan o puedan tener éstos, también las herramientas que hayan sido necesarias para su resolución, además de otras razones y sin olvidar el placer de poder disfrutar con lo que a uno le gusta, igual que se lee o se hacen crucigramas. Leyendo el artículo puedes… Lee más »
Tienes toda la razón Daniel, en verdad es para molestarse pues todo en esta vida es el resultado de algo anterior que se haya logrado, y por lo menos el poder demostrar algo que nadie lo había hecho en más de dos siglos, merece respeto. No importa que por el momento no tenga utilidad práctica, pero es un paso más hacia adelante que la humanidad ha logrado.
[…] Solución en 3D para el enigma de los azulejos que aparecen y desaparecen … en Gaussianos. 55. Harald Andrés Helfgott nos habla sobre su demostración de la conjetura débil de Goldbach … en Gaussianos. 56. La historia del método de Newton-Raphson y otro caso más de mala […]
Felicitaciones al matemático peruano Harald Helfgott, ojala sea galardonado con la Fields Medal.
No es el primer matemático peruano que resuelve una conjetura matemática. Anteriormente el matemático Carlos Teobaldo Gutiérrez Vidalon fue el primero en resolver la conjetura Markus-Yamabe.
http://www.mat.uff.br/sotomayor09.pdf
Felicitaciones al matemático peruano Harald Andres Helfgott, ojala sea galardonado con la Fields Medal.
No es el primer matemático peruano que resuelve una conjetura matemática. Anteriormente el matemático peruano Carlos Teobaldo Gutiérrez Vidalon especilizado en sistemas dinámicos, fue el primero en resolver la conjetura Markus-Yamabe.
http://www.mat.uff.br/sotomayor09.pdf
http://arxiv.org/abs/math/0311386
Es exactamente lo que él comentaba en sus exposiciones en Perú ( fui a las dos, una en la UNI y otra en UNMSM), es más hasta parece sacado del ppt con el que hacia su exposicion…no te habrá pasado su ppt? si es asi no podrias compartirlo?
Luis Felipe, no, no lo tengo :(.
Buenos días
Hace unos meses trato de contactarme con Harald Andrés Helfgott , ya que estoy escribiendo un libro sobre creatividad y matemáticas , y necesito la opinion de el sobre temas matemáticos si ustedes saben su mail les agradecería .
Si ustedes conocen matemáticos que me quieran dar una mano les agradecería, lo que busco es entender los procesos creativos de las matemáticas para llevarlos a la aula de clases
Saludos
Yo lo entiendo perfectamente al tocayo José sobre su vaga opinion sobre personas que se dedican profundamente a estudiar los infinitos temas de interez, son dos cosas el amigo José es un verastil intelecual poco conocido en el ámbito internacional que se da el lujo de cuestionar al eminiente matematico sunmaculaude de Princeton, ò es un simple personaje que desconoce totalmente los albores elementales de la matemática.
Agradecería opiniones sobre una demostración de la Conjetura de Goldbach con un planteamiento original y que se puede consultar en: http://viXra.org/abs/1406.0026
Muy buena, pero yo tengo la demostracion de la conjetura de Golbach completa.
oigan, alguien sabe donde se publican ese tipo de soluciones a problemas enigmáticos?, por favor
https://www.blogger.com/blogger.g?blogID=2508273133944774076#editor/target=post;postID=4909937115398108668;onPublishedMenu=allposts;onClosedMenu=allposts;postNum=0;src=postname
este es el link para mi solución de la conjetura de goldbach fuerte
si pueden leerlo y decirme posibles fallos me seria de gran ayuda, en el caso de que les parezca que es correcto que me ayuden a difundirlo
Excelente el artículo. Lo leí como si fuera una novela, pero considerando la profundidad del tema. Felicitaciones y éxito para todos. La ciencia real es la matemática las demás ciencias las usan como herramienta. Dios es matemático…!
¿Qué libros me recomiendan para entender la demostración?
Y si se ha resuelto la conjetura débil, ¿por qué no se puede la conjetura fuerte?
Excelente el trabajo realizado por D. Platt y el Dr. Harald Andres Helfgott sobre la Conjetura Débil de Goldbach, logrando comprobar hasta C= 10^29 (exactamente hasta 8.8*10^30). que pudieron ser comprobados a mano (literalmente a mano o con un ordenador); gracias al trabajo de parte de Olivera e Silva, Herzog y pardi que pudieron demostrar que la Conjetura Primaria (Fuerte) de Goldbach era cierta hasta 4*10^18 , esto es, todo numero hasta 4*10^18 es igual a la suma de dos números primos. Gracias a la calculadora de números primos, he podido comprobar en forma manual, la Conjetura Fuerte de Goldbach,… Lee más »
Si esta dispuesto desarrolla una solución hace unos meses , podríamos hablar del tema y tratar algún tipo de publicación
Buenas noches estimado Antonio, te escribo desde Peru y me gustaria saber si tienes conocimientos sobre algunos avances en demostraciones de la Conjetura Fuerte (Binaria) de Goldbach. Tambien si me puedes informarme donde se puede realizar las publicaciones si uno quisiera demostrar esta Conjetura. Le agradesco por anticipado.
Tengo mis avances hechos en el tema con una solución propia bastante exacta , ando con problemas para una combropacion a confirmación , se debería hacer en revistas del tipo o por contacto pero no tengo conocimiento de las revistas comonpara hacerlo de forma serie , ni gente que sepa y l pueda comprobarlo y publicar , te puedo decir solución y cooperar para hacer una publicación
Estimado Antonio, te puedo informar que he podido comprobar la Conjetura fuerte (Binaria) de Golbach para numeros pares mayores a 2 hasta 10^128 , en forma selectiva y se pude comprobar para todos los numeros pares mayores a 2 como establece el enunciado; para ello he utilizado la Calculadora de Numeros Primos que esta en la Web lo que me ha permitido realizar la verificacion de numeros pares hasta 10^128 , por que ese es el limite de la Calculadora de Numeros Primos y tambien se puede Comprobar que se cumple tambien la Conjetura Debil (Ternaria), por que cae por… Lee más »
https://zuritaa766.blogspot.com/2018/02/solucion-la-conjetura-fuerte-de.html
Aquí tendría todo para revisarlo , según compruebe me vendría muy bien su ayuda para divulgado y difundirlo en ninhomnre con una remuneración económica del premio , le estaría agradecido tanque tengo otra conjetura resuelta esperando a una demostración y varios proyectos por publicar , me facilitaría mucho el trabajo
Estimado Antonio, revisare y analizare su informacion para ver si tenemos posiciones convergentes en relacion a la Conjetura Fuerte (Binaria) de Goldbach y le escribire y me comunicare con Ud. Hasta Pronto.
Antoniozg0812@gmail.com , este es mi correo, por si tiene algún resultado que me avise
Estimado Antonio, le escribo desde Perú ciudad de Iquitos siendo las 11:35 p.m. del día 1 de Enero del 2019 le deseo un Feliz y Próspero Año Nuevo. Para comentarle que visite su blogspot.com y e visto que su demostración de la Conjetura Binaria de Goldbach se fundamenta mayormente en aspectos teóricos y debo decirle que en mi opinión las demostraciones matemáticas se hacen con números y en una forma simple y sencilla para que no quede ninguna duda. Le vuelvo a comentar que para mí demostración de la Conjetura Binaria y Ternaria de Goldbach utilizo gráficas para cada número… Lee más »
Vale aunque prefiero si lo hacemos por correo es más cómodo, le deje el mío arriba , además según mi punto no es coger un número primo al azar y demostrarlo sino que según la estructura de la suma de primos a mayor sea el par la probabilidad estadística de que haya una combinación s mantiene ya que el aumento de decenas y posibilidades se compagina con el aumento de posibles números primos que descartan de forma equitativa , cada vez hay más espacio entre nuevo aumento de decenas posibles al haber menos posibilidad estadística de que ese posible número… Lee más »
Hola Antonio. He leído tu blog, y aunque me parece un trabajo interesante, está lejos de ser una demostración matemática. Lo que tienes es una idea (algo muy importante) de porque la conjetura podría ser cierta, basandote en que hay una cantidad infinita de números primos. No obstante, insisto en que eso no es una demostración válida sino una idea.
¿Y por que no vale como demostracion , si lo demuestra?
Porque no es una desmotración, estrictamente hablando. Una demostración hace uso de teoremas y axiomas para llegar a un resultado de forma lógica. Lo que tú tienes es una idea sin demostrar; trataré de dar un ejemplo de porque no es válido (obviamente, como en todo ejemplo, se perderá algo, pero espero que valga la pena). La suma de la serie armónica es, como sabemos, divergente. Uno podría argumentar (sin demostrar) que es claro que es divergente, puesto que se suman infinitos terminos no nulos (error grave, como veremos a continuación). Ahora yo presento la suma de la serie desde… Lee más »
En si msimo es una demostración si has entendido lo que escribí, decir que no es una demostración por no seguir determinado procedimiento aún demostrando es absurdo
En si mismo no e sun contrargumento al descarte de sumas mediante el cálculo estadístico de su descarte el cual de firma a nivel educacional llega a evidenciar que nunca se descartan todas
https://twitter.com/horaciouseche/status/1150858817632120832