viernes, 23 de diciembre de 2011

La probabilidad en la Física

La probabilidad es un tema muy extenso y tiene diversos enfoques; aquí no trataremos los aspectos técnicos, sino que nuestro objetivo será comprender sus fundamentos y su significado en todo aquello que sea aplicable a las ciencias físicas.

El científico hace un uso muy bien definido de las probabilidades; cuando un físico dice que la probabilidad de desintegración  por unidad de tiempo de un núcleo de carbono-14 es de 3,6113594·10⁻⁴ por segundo, su afirmación tiene un carácter muy específico, mientras que en cambio si le preguntamos por la probabilidad de que la teoría de cuerdas sea correcta quizá se encogerá de hombros, ¡y esa actitud también tiene un significado bien definido!

Razonamiento inductivo y razonamiento deductivo
El denominado razonamiento inductivo se caracteriza por establecer conclusiones que no son totalmente seguras a partir de unos datos. Por ejemplo, en la inferencia estadística, un tipo de razonamiento inductivo, se formulan conclusiones sobre toda una población basándose en una muestra; sería el caso de afirmar que la intención de voto al partido "XYZ" es del 30% de la población cuando sólo se ha encuestado a una cienmilésima parte de la población. Trabaja pues con elementos de juicio incompletos en los cuales no es aplicable la exactitud. Es un modo de trabajo habitual en las ciencias correlacionales, como la Psicología o la Economía. Por otro lado el razonamiento deductivo establece conclusiones que se siguen necesariamente de los datos. Es el método habitual en las ciencias exactas.

Evidentemente no podemos ser rígidos en esta clasificación, y debemos aceptar que las ciencias no exactas pueden usar razonamientos deductivos, y que también las ciencias exactas son usuarias del razonamiento deductivo; un ejemplo paradigmático de éste último caso es la investigación experimental de las partículas fundamentales en aceleradores de partículas, para ser más concretos citaremos el posible descubrimiento del bosón de Higgs en el 2012, que de producirse no será anunciado con total certeza, sino con una probabilidad muy elevada, cercana pero no igual al 100%. Para más detalles sobre probabilidades en Física experimental podéis visitar este artículo del blog de la mula Francis. Dicho esto, podemos afirmar que las ciencias exactas son predominantemente deductivas, y que las ciencias correlacionales son inductivas; además, estas últimas se esfuerzan por convertirse en exactas en la medida de sus posibilidades.


Ciencia deductiva y probabilidad
Así, cuando las ciencias deductivas utilizan probabilidades, no las considera como una forma de expresar el grado de seguridad de una afirmación, sino como una magnitud mensurable, en igualdad con otras magnitudes como las longitudes, velocidades, aceleraciones, etc.
Como ejemplo, consideremos de nuevo la probabilidad de desintegración de un núcleo radiactivo de carbono-14. Dada una cantidad inicial N(0) de material radiactivo, al cabo de cierto tiempo t la cantidad que quedará viene dada por la ley de la desintegración radiactiva

N(t) = N(0)·e-Pt 

donde P es la probabilidad de desintegración por unidad de tiempo; entonces vemos que P = (1/t)·Ln (N(0) / N(t)) es un valor constante, determinado, que  de hecho es una propiedad del material: podemos establecer su valor en el laboratorio midiendo la cantidad de material residual con diferentes valores del tiempo t. Por tanto la probabilidad P se determina midiendo, es una magnitud mensurable.


La probabilidad mensurable y los errores experimentales
Podemos objetar que la medición de cualquier magnitud física conlleva la probabilidad de cometer errores, de modo que al definir la probabilidad deductiva como mensurable caemos en un círculo vicioso. Aclaremos este punto.

Es cierto que en el laboratorio siempre se toman diversas medidas de una magnitud y después se promedian, con el propósito de minimizar el error cometido. En este procedimiento no hay necesidad de probabilidades, excepto para estudiar la distribución de los errores experimentales. Si consideramos ahora la determinación de la probabilidad como magnitud veremos que hay que proceder del mismo modo que para cualquier otra magnitud: tomaremos medidas repetidas de la probabilidad (pensemos por ejemplo en el carbono-14) y las promediaremos para obtener el valor físico aproximado, dentro de la precisión requerida. Admitido esto, no hay nada incoherente en la definición dada de la probabilidad como magnitud física.


Definiciones clásicas de la probabilidad
La conocida regla de Laplace considera que la probabilidad de un suceso es el cociente entre el número de casos favorables al suceso y el número total de casos posibles, siempre que estos sean igualmente probables. Un ejemplo típico es determinar la probabilidad de obtener un número par en el lanzamiento de un dado:

P(número par) = card({2,4,6} / card({1,2,3,4,5,6}) = 3/6 = 1/2,

Un dado físicamente es un cubo simétrico, y por tanto podemos considerar que al lanzarlo la probabilidad de que cualquier cara quede en la parte superior es igual para todas ellas.



donde "card" indica el operador que nos da el número de elementos de un conjunto. Esta definición nos permite calcular probabilidades antes de realizar cualquier medición, siempre que conozcamos el número de casos. Es una fórmula exacta, sin errores.

Otra definición es la frecuencial: afirma que la probabilidad de un suceso es el cociente entre la frecuencia con la que se presenta el suceso y el número total de repeticiones del experimento, suponiendo que este último es muy grande;  a este cociente se le denomina frecuencia relativa, de forma que la probabilidad es la frecuencia relativa cuando el número  de repeticiones es grande.   Es una definición empírica, pues el valor obtenido depende del experimento.

Experimentalmente se ha comprobado que las dos definiciones, la de Laplace y la frecuencia, coinciden cuando el número de repeticiones n del experimento se hace arbitrariamente grande (ley de regularidad estadística).  La definición frecuencial de la probabilidad usa el concepto de límite: la probabilidad de obtener un cierto resultado de un experimento aleatorio es la frecuencia  relativa obtenida al repetir el experimento infinitas veces.

En la siguiente figura, en la parte superior, se muestran en el eje vertical las frecuencias relativas obtenidas en la simulación del lanzamiento de una moneda 400 veces, anotando las caras obtenidas, y en eje horizontal el número de lanzamientos (la escala es logarítmica). Vemos que las frecuencias oscilan con amplitud decreciente, estabilizándose progresivamente cerca del valor 0.5, que  tomaríamos como probabilidad en el sentido frecuencial. Este valor coincide con el obtenido mediante la regla de Laplace: P(salga cara) = card {"cara"} / {"cara", "cruz"} = 1/2.

Comparación de los límites de la frecuencia relativa con el de una suma infinita; el primero se acerca al límite de forma lenta e irregular, el segundo rápida y regularmente.
En la gráfica inferior se muestra la evolución de la suma infinita (1/2)·[(1/2) + (1/2)²+(1/2)³ + ... ] que tiene como valor límite 1/2. Vemos que esta suma se acerca a su límite mucho más rápido y de forma menos errática que la  probabilidad. Ademas, en el caso de la probabilidad siempre podemos encontrar una desviación amplia del valor 1/2 para cualesquiera valores de n; cuando n es grande sucede raramente, pero no es imposible, mientras que en el caso del límite matemático "habitual" las desviaciones arbitrarias no se producen. Así pues, el concepto de límite de la probabilidad frecuencial presenta diferencias respecto a los límites de funciones tal como se definen en los textos de cálculo.



Probabilidad de conjuntos infinitos
La definición frecuencial nos proporciona un concepto útil para interpretar la probabilidad (la frecuencia relativa teórica que esperamos encontrar en un experimento ideal con infinitas repeticiones, pero no es nada práctica. La fórmula de Laplace en cambio nos proporciona un método de cálculo. Es un hecho notable que los valores numéricos proporcionados por ambas definiciones coincidan. Utilizadas conjuntamente nos permiten resolver un gran número de problemas. 

Una limitación importante aparece cuando el conjunto de posibles resultados es infinito; por ejemplo, estamos interesados en saber cuál es la probabilidad de encontrar una molécula en una región del espacio. Siendo la posición una variable continua, el número de posiciones posibles dentro de cualquier intervalo será infinito, por lo que la regla de Laplace no está bien definida.

Se han propuesto definiciones más generales de la probabilidad que permiten enfrentarse a estos casos con infinitas posibilidades: los conjuntos denominados conjuntos de Borel (o borelianos) y  la medida de Lebesgue. Con estas herramientas podemos incluso calcular probabilidades asociadas a conjuntos "rebuscados".

Por ejemplo, ¿cual es la probabilidad de que, al escoger al azar un punto x cualquiera del  intervalo [0, 1], el punto escogido sea un número racional? Hay infinitos racionales en cualquier intervalo, e infinitos números en el intervalo [0, 1], con lo que la regla de Laplace resultaría en un infinito / infinito que es un valor indeterminado.

La definición frecuencial también se pone en apuros con problemas de este tipo, pues los generadores de números aleatorios realmente no son del todo aleatorios, ya que usan algoritmos deterministas, y además que yo sepa no suelen generar números irracionales. Los nuevos ordenadores cuánticos podrían quizá resolver este problema, ver por ejemplo el artículo Evidencias de que los procesos cuánticos generan números aleatorios verdaderos.

Hay conjuntos más complicados,  como por ejemplo el conjunto de Cantor, que se construye de modo recursivo.

Construcción del conjunto de Cantor. Seguimos los siguientes pasos:
  • Tomamos el intervalo [0, 1].
  • Le quitamos un tercio de intervalo, concretamente el intervalo abierto (1/3; 2/3). Nos quedan los intervalos [0, 1/3] y [2/3, 1]
  • Quitamos a los dos segmentos restantes sus respectivos tercios interiores, es decir los intervalos abiertos (1/3²; 2/3²) y (7/3²; 8/3²).
  • Los pasos siguientes son idénticos: quitar el tercio de todos los intervalos que quedan. El proceso no tiene fin.

El conjunto de Cantor C tiene infinitos puntos; de hecho se da la paradoja de que contiene tantos puntos como todo el intervalo [0, 1]. que contiene a C. Por la regla de Laplace la probabilidad de escoger un punto de C sería card(C) / card([0,1]) = 1, que es absurdo, ya que  una probabilidad de un suceso igual a 1  significa que el suceso se presenta siempre, es decir que x siempre pertenecerá a C. En cambio usando la teoría de Lebesgue, la medida de C resulta ser cero, y  por consiguiente la probabilidad de que al escoger un punto al azar del intervalo [0, 1] el punto pertenezca a C es cero. Una excelente descripción de los conjuntos de Cantor y sus curiosas propiedades, así como su teoría de los números trans-infinitos la ofrece este blog.

Mecánica estadística
Volvamos a la Física, concretamente a la Física a escala molecular. A estas escalas debemos aplicar los principios de la mecánica cuántica, que establece que la energía de cada molécula sólo puede tomar unos valores discretos., está cuantizada. Para simplificar, pensemos en un gas; una molécula libre de gas moviéndose en un recipiente tendrá un estado, variable, definido por tres  números cuánticos, uno para cada dimensión del espacio, y cada estado permitido define un nivel de energía. Conociendo la distribución de las partículas entre los estados permitidos de energía del gas, se pueden predecir sus propiedades macroscópicas de interés (denominadas observables), como la temperatura, la presión, la densidad, etc.

Moléculas de un gas en un recipiente, cada molécula rebota con las paredes y con otras moléculas, cambiando su velocidad continuamente. La velocidad media a temperatura ambiente es del orden de cientos de metros por segundo.

Dado el enorme número de moléculas existentes, del orden de 1018 por cada cm³, la determinación de sus energías se ha de realizar usando técnicas estadísticas. Así, no determinamos energías, sino probabilidades de tener ciertas energías.
Distribución de probabilidades de velocidades de Maxwell-Boltzmann para los gases nobles, en el eje horizontal se muestran las velocidades de las moléculas, en el vertical las probabilidades.

Se han formulado diversas técnicas de cálculo de probabilidades ajustadas a cada tipo de moléculas; por ejemplo, si todas las partículas son iguales (más precisamente: indistinguibles), y cada estado de energía puede ser ocupado por todas las moléculas sin restricciones, las probabilidades viene dadas por la denominada distribución de probabilidad de Bose-Einstein. Si las partículas son distinguibles, entonces se aplica la distribución de Maxwell-Boltzmann. Estas probabilidades pueden aplicarse a sistemas generales de muchas partículas cuánticas, como por ejemplo los fotones.
Tal como decíamos al principio, las probabilidades calculadas en Física Estadística son magnitudes medibles, y su concepto es distinto del de las probabilidades más comunes, como la de sacar un número par cuando lanzamos un dado. Por ejemplo, la temperatura de un cuerpo, un observable, está directamente relacionada con el valor medio de las velocidades de sus moléculas, que a su vez está determinada por su distribución de probabilidades.

Bibliografía
  • Sobre mecánica Estadística: F.W. Sears: Termodinámica, teoría cinética y termodinámica estadística. Ed. Reverté.
  • Sobre la probabilidad en las ciencias exactas: H. Margenau: La naturaleza de la realidad física. Ed. Tecnos.
  • Sobre conjuntos de Borel y medida Lebesgue: T. Apostol: Análisis Matemático. Ed. Reverté.
  • Sobre aplicación de las medidas Lebesgeu en la probabilidad: E. Elizalde: Métodos matemáticos algebraicos, tomo III. Universidad de Barcelona.


3 comentarios:

  1. Yo creo que solo con determinismo se vence al azar en orden a los resultados y su progresión, o evolución, es decir en un proceso idealizador como lo es la realidad ir completando resultados hasta obtener uno perfecto e insuperable que es el final, todo siguiendo un orden perfecto o ideal vamos hasta llegar a lo insuperable (orden lo contrario de azar o caos)...

    ResponderEliminar
  2. Lo que quiero decir es que todo deben de ser efluvios de las personas y estas mismas efluvios del universo....

    ResponderEliminar

Los comentarios por favor que sean sobre el tema del artículo, y siempre para completar, o para preguntar. No se admitiran comentarios que no cumplan estas premisas ni por supuesto que sean ofensivos bajo ningun concepto.

Discutir, dialogar, convencer: del razonamiento estrecho, luchador al razonamiento ámplio, amable

La verdad absoluta no está disponible Releyendo Logicomix una épica búsqueda de la verdad , un fantástico cómic sobre el principal tema de ...