Tuesday, June 03, 2008



INCERTIDUMBRE

Probabilidad


El conocimiento sobre la manera en que opera el mundo está limitado por lo menos por cinco tipos de incertidumbre: 1. conocimiento inadecuado de todos los factores que pueden influir en algo; 2. número inadecuado de observaciones sobre esos factores; 3. falta de precisión en las observaciones; 4. carencia de modelos apropiados para combinar toda la información de modo significativo, y 5. capacidad inadecuada para calcular a partir de los modelos. Es posible predecir algunos sucesos con mucha precisión (eclipses), otros con meros exactitud (elecciones) y otros con muy poca certeza (terremotos). Aunque la certidumbre absoluta es casi imposible de conseguir, con frecuencia se puede estimar la probabilidad sea grande o pequeña de que algunas cosas sucedan y el margen probable de error de la estimación.

Con frecuencia resulta útil expresar la probabilidad en forma numérica. Por lo general se utiliza una escala de probabilidad de O a 1, donde el O indica la creencia de que algún suceso específico es seguro que no ocurrirá, el 1 indica la creencia de que es seguro que sucederá y el intervalo entre los dos indica certidumbre. Por ejemplo, una probabilidad de 0.9 indica que hay 9 oportunidades en 10 de que ocurra un suceso como se predijo; una probabilidad del 0.001 indica que hay solamente una oportunidad en 1 000 de que ocurra. También se pueden expresar las probabilidades como porcentajes, que van desde 0% (no hay certeza) hasta el 100% (certeza).

Las incertidumbres también pueden expresarse como desigualdades: una probabilidad de 0.8 para un evento puede expresarse como las posibilidades de 8 a 2 (o 4 a 1) en favor de que ocurra.
Una manera para estimar la probabilidad de un evento es considerando los acaecimientos pasados. Si la situación actual es similar a las anteriores, entonces se pueden esperar resultados algo similares. Por ejemplo, si llovió el 10% de los días de verano del año pasado, se puede esperar que llueva aproximadamente el 10% de los días del siguiente verano. Así, una estimación razonable de la probabilidad de lluvia de cualquier día de verano es 0. 1 una oportunidad en 10. La información adicional puede cambiar la estimación de la probabilidad. Por ejemplo, pudo haber llovido el 40% de los días nublados del pasado verano; de modo que, si el día actual está nublado, se puede aumentar la estimación de 0.1 a 0.4 para la probabilidad de lluvia. Cuanto más se parezca la situación que interesa a aquélla de la que se tienen datos, mayor es la probabilidad de que la estimación resulte más acertada.

Otro enfoque para estimar las probabilidades es considerar los posibles y distintos resultados de un suceso específico. Por ejemplo, si hay 38 ranuras de amplitud igual en una ruleta rusa, se puede esperar que la bola caiga en cada ranura más o menos 1/38 veces. Las estimaciones de esa probabilidad teórica descansan en la suposición de que todos los resultados posibles son razonables y es igualmente probable que todos ocurran. Pero si ello no es cierto por ejemplo, si las ranuras no son de igual tamaño o si en ocasiones la bola se sale de la ruleta, la probabilidad calculada será errónea.

Las probabilidades son muy útiles para predecir proporciones de resultados en grandes cantidades de eventos. Una moneda lanzada al aire tiene una probabilidad de 50% de que caiga cara, aunque una persona no va conseguir precisamente 50% de caras en un número par de lances. Cuanto más se lance una moneda, será menos probable que uno consiga una cantidad precisa del 50%, pero la proporción más cercana de caras es probable que sea el teórico 50%. De igual manera, las compañías aseguradoras pueden, dentro de un rango de uno o dos puntos porcentuales, predecir la proporción de personas de 20 años que morirá en un año especifico, pero es probable que se equivoquen por miles de muertes totales y no tienen ninguna capacidad de predecir si alguien en particular que tenga 20 años morirá. En otras palabras, también es importante distinguir entre la proporción y la cifra real. Cuando hay una gran cantidad de sucesos similares, aun un resultado con una probabilidad muy pequeña de ocurrir puede suceder con mucha frecuencia. Por ejemplo, un examen médico con una probabilidad de 99% de ser correcto puede parecer muy preciso pero si ese examen se hubiera aplicado a un millón de personas, aproximadamente 10 000 individuos recibirían resultados falsos.

Resumen de datosa

La información se encuentra alrededor de todos, a menudo en tan grandes cantidades que no es posible darle sentido. Un conjunto de datos se puede representar a través de un resumen de características que pueden revelar u ocultar aspectos importantes. La estadística es una rama de las matemáticas que desarrolla métodos útiles de organizar y analizar grandes cantidades de datos. Por ejemplo, para tener una idea de lo que es un conjunto de datos, se podría trazar cada caso en una recta numérica, y después inspeccionar la gráfica para ver dónde se acumulan los casos, dónde se separan unos de otros, dónde se encuentran los más altos y los más bajos, y así sucesivamente. De forma alternativa, el conjunto de datos se puede caracterizar de manera resumida describiendo dónde se halla su centro y cuánta variación hay alrededor de él.

El estadístico más conocido para resumir una distribución de datos es la media, o promedio común, pero se debe ser cuidadoso al usarla o interpretarla. Cuando los datos son discretos (como el número de hijos por familia), la media no podría ser un valor posible (por ejemplo, 2.2 hijos). Cuando los datos se inclinan mucho hacia un extremo, la media tampoco puede estar cerca de un valor común. Por ejemplo, una proporción pequeña de personas que tienen ingresos personales muy altos puede aumentar la media mucho más de lo que la mayoría de las personas concentradas en el extremo más bajo sería capaz de disminuirla. La mediana, la cual divide la mitad inferior de los datos de la mitad superior, es más significativa para muchos propósitos. Cuando sólo hay unos cuantos valores discretos de una cantidad, el tipo de promedio más informativo puede ser la moda, la cual es el valor único más común por ejemplo, el número más común de automóviles por familia en los Estados Unidos de América es 1.

En general, los promedios por sí mismos no hacen caso de la variación en los datos y pueden implicar más uniformidad de la que existe. Por ejemplo, la temperatura promedio en el planeta Mercurio de aproximadamente 150 F no suena tan mal hasta que uno considera que ésta oscila desde 3000 F hasta 3000 F bajo cero. El descuido de la variación puede ser particularmente engañoso cuando se comparan promedios. Por ejemplo, el hecho de que la estatura promedio de los hombres sea claramente mayor que la de las mujeres, se podría enunciar como "los hombres son más altos que las mujeres", en tanto que existen muchas mujeres que son más altas que muchos hombres. Por tanto, para interpretar promedios, es importante tener información sobre la variación dentro de los grupos, como la gama total de datos o la gama cubierta por el 50%. Una gráfica de todos los datos a lo largo de una recta numérica hace posible ver la forma en que se distribuyen los datos.

Con frecuencia se presentan datos resumidos que pretenden demostrar una relación entre dos variables, pero carecen de información esencial. Por ejemplo, la afirmación de que "más del 50% de las parejas casadas que tienen diferentes religiones se divorcian" no diría nada acerca del vínculo entre la religión y el divorcio a menos que se conozca también el porcentaje de parejas que se divorcian teniendo la misma religión. Sólo la comparación de los dos porcentajes podría indicar si existe una relación real. Aun entonces, es necesaria la precaución por los posibles sesgos en la manera en que se seleccionaron las muestras y por las diferencias en porcentaje que puedan ocurrir sólo por el azar al seleccionar la muestra. Los informes apropiados de esa información deberán incluir una descripción de posibles fuentes de sesgos y una estimación de la incertidumbre estadística en la comparación.

Dos cantidades se correlacionan en forma positiva si tener más de una se asocia con tener más de la otra. (Una correlación negativa significa que tener más de una se asocia con tener menos de la otra.) Pero incluso una correlación fuerte entre dos cantidades no significa que una sea necesariamente la causa de la otra. Una de ellas podría causar la otra, o ambas podrían ser el resultado común de un tercer factor. Por ejemplo, la expectativa de vida en una comunidad se correlaciona positivamente con el número promedio de teléfonos por casa. Uno podría buscar una explicación de por qué tener más teléfonos mejora la salud de los individuos o por qué las personas sanas compran más de estos aparatos. Sin embargo, es más probable que tanto la salud como el número de teléfonos sean la consecuencia del grado general de riqueza de la comunidad, lo cual afecta la calidad total de la nutrición y el cuidado médico, así como la inclinación de las personas a comprar teléfonos.

Muestreo de datos

La mayor parte de lo que se aprende sobre el mundo se obtiene de información basada en muestreos de lo que se está estudiando por ejemplo, muestras de formaciones rocosas, luz de las estrellas, televidentes, enfermos de cáncer, ballenas, números, etc.. Se hace uso de las muestras porque resultaría imposible, impráctico o demasiado costoso examinar el todo de algo, y porque una muestra, por lo general, es suficiente para la mayor parte de los propósitos. Al sacar conclusiones sobre un todo a partir de muestras, se deberán tomar en cuenta dos aspectos principales. Primero, se debe estar alerta a posibles sesgos originados por la forma en que se selecciona la muestra. Las fuentes comunes de sesgos al seleccionar muestras incluyen la conveniencia (por ejemplo, entrevistar sólo a los amigos o recoger solamente rocas de la superficie), la auto selección (por ejemplo, estudiar únicamente a la gente que coopera voluntariamente o a quienes regresan los cuestionarios), el fracaso para incluir a aquellos que se han retirado a lo largo del camino (por ejemplo, examinar sólo a estudiantes que permanecen en la escuela o a pacientes que siguen el curso de una terapéutica) y la decisión de usar sólo los datos que apoyen las propias concepciones previas.

El segundo aspecto importante que determina la utilidad de una muestra es su tamaño. Si ésta se obtiene sin sesgos en el método, entonces, cuanto más grande es, mayor es la probabilidad de que represente al todo con exactitud. Esto es así porque, cuanto mayor es la muestra, es más probable que los efectos menores de las variaciones debidas al puro azar estén en sus características resumidas. La probabilidad de extraer una conclusión equívoca disminuye a medida que el tamaño de la muestra se incrementa. Por ejemplo, para las muestras escogidas al azar, encontrar que 600 de una muestra de 1 000 tienen una cierta característica, es una evidencia mucho más fuerte de que una mayoría de la población presenta esa característica que descubrir que 6 de una muestra de 10 (o incluso 9 de 10) la tienen. Por otro lado, el tamaño real de la población total de la cual se extrae una muestra tiene poco efecto en la exactitud de los resultados de ésta. Una muestra aleatoria de 1 000 podría tener aproximadamente el mismo margen de error si se selecciona en una población de 10 000 o en una similar de 100 millones.

RACIOCINIO

Algunos aspectos del raciocinio tienen reglas lógicas claras, otros sólo poseen principios y otros más tienen espacio casi in ilimitado para la creatividad (y desde luego para el error). Un argumento convincente requiere enunciados verdaderos y relaciones válidas entre ellos. Sin embargo, la lógica formal se interesa en la validez de las relaciones entre los enunciados, no si éstos son en realidad verdaderos. Es correcto desde un punto de vista lógico argumentar que si todos los pájaros vuelan y los pingüinos son pájaros, entonces los pingüinos vuelan. Pero la conclusión no es verdadera si las premisas no son verdaderas: ¿de verdad vuelan todos los pájaros y los pingüinos son realmente pájaros?

El análisis de la verdad de las premisas es tan importante para un buen raciocinio como la lógica que opera en ellas. En este caso, ya que la lógica es correcta pero la conclusión es falsa (los pingüinos no pueden volar), una o ambas premisas deben de ser falsas (no todos los pájaros vuelan, o los pingüinos no son pájaros).
Los argumentos lógicos muy complejos se pueden construir a partir de un pequeño número de pasos lógicos, los cuales dependen del uso preciso de los términos básicos "si","y""o" y "no". Por ejemplo, el diagnóstico médico implica cadenas lógicas ramificadas como "si el paciente padece la enfermedad X o Y y también tiene un resultado de laboratorio B, pero no tiene antecedentes de C, entonces debe aplicarse el tratamiento D”. La solución de ese problema lógico puede requerir conocimiento experto de muchas relaciones, acceso a muchos datos para alimentar las relaciones y la habilidad para deducir cadenas ramificadas de operaciones lógicas. Ya que las computadoras pueden almacenar y devolver grandes cifras de relaciones y datos, además de que pueden realizar largas series de pasos lógicos muy rápido, se están utilizando cada vez más para ayudar a los expertos a resolver complejos problemas que de otra manera sería difícil o hasta imposible resolverlos. No obstante, no todos los problemas lógicos se pueden solucionar por computadora.

Las relaciones lógicas pueden distorsionarse con facilidad. Por ejemplo, la proposición de que todos los pájaros pueden volar, no implica lógicamente que todas las criaturas que vuelen sean pájaros. Tan obvio como puede parecer este ejemplo sencillo, la distorsión ocurre a menudo, sobre todo en situaciones cargadas emocionalmente. Por ejemplo: "todos los prisioneros culpables rehúsan testificar contra si mismos; el prisionero Sánchez se negó a testificar contra él mismo; por tanto, Sánchez es culpable."

Las distorsiones en lógica provienen a menudo de no distinguir entre las condiciones necesarias y las suficientes. Siempre se requiere una condición necesaria para una consecuencia, pero puede no ser suficiente por sí misma por ejemplo, ser ciudadano de la Unión Americana es necesario para ser electo presidente, pero no suficiente. Una condición que es suficiente para una consecuencia se basta a si misma, pero puede haber otras formas de llegar al mismo resultado ganar la lotería estatal es suficiente para convertirse en millonario, pero hay otras maneras. Sin embargo, una condición puede ser tanto necesaria como suficiente; por ejemplo, recibir la mayor parte de los votos electorales es una condición tanto necesaria para convertirse en presidente como suficiente para hacerlo, pues es la única forma.

La lógica tiene utilidad limitada para encontrar la solución a muchos problemas. Fuera de los modelos abstractos, con frecuencia, no se puede establecer con confianza la verdad de las premisas o las relaciones lógicas entre ellas. La lógica precisa requiere declaraciones como: "Si X es verdadera, entonces Y también es verdadera" (perro que ladra no muerde), y "X es verdadera" (el canuto ladra). Sin embargo, de manera típica, todos saben que "si X es verdadera, entonces Y también a menudo es verdadera" (un perro que ladra suele no morder) y "X parece ser aproximadamente verdadera casi todo el tiempo" (el canuto generalmente ladra). Por tanto, la lógica estricta se reemplaza con frecuencia por las probabilidades u otros tipos de razonamiento que conducen a resultados mucho menos certeros; por ejemplo, afirmar que en promedio la lluvia caerá antes del anochecer en el 70% de los días que tengan mañanas con condiciones meteorológicas similares a las del día de hoy.

Si se aplica la deducción lógica a una regla general (todas las criaturas con plumas vuelan), se puede llegar a una conclusión acerca de un caso particular o clase de casos (los pingüinos vuelan). Pero, ¿de dónde provienen las reglas generales? A menudo son generalizaciones hechas a partir de observaciones: descubrir un número de casos similares y suponer que lo que es verdad para ello es verdad para toda la clase ("toda criatura con plumas que he visto puede volar; por tanto, quizá todas puedan hacerlo"). O una regla general puede surgir de la imaginación, por medios no conocidos, con la esperanza de poder demostrar que algunos aspectos de los fenómenos se derivan lógicamente de ella (por ejemplo: "si fuera verdad que el Sol es el centro del movimiento de todos los planetas, incluida la Tierra, ¿tal sistema podría producir los movimientos aparentes en el cielo?").

Una vez que una regla general se ha elevado a la categoría de hipótesis por cualesquiera medios, la lógica sirve para comprobar su validez. Si se descubre un caso contrario (una criatura con plumas que no puede volar), la hipótesis no es verdadera. Por otro lado, la única manera de probar lógicamente que una hipótesis general acerca de una clase es verdadera consiste en examinar todos los casos posibles (todas las aves), lo cual es difícil en la práctica y a veces imposible incluso en principio. Así, suele ser mucho más fácil probar que las hipótesis generales son lógicamente falsas que probar que son verdaderas. En la actualidad, las computadoras a veces hacen posible demostrar de manera convincente la verdad de generalizaciones matemáticas dudosas, incluso si no se prueban, sometiendo a prueba enormes cantidades de casos específicos.

La ciencia puede usar la lógica deductiva silos principios generales acerca de los fenómenos se han establecido como hipótesis, pero tal lógica no puede conducir a esos principios generales. Suele arribarse a los principios científicos generalizando a partir de un número limitado de experiencias; por ejemplo, sí todas las criaturas con plumas que se han observado nacen de huevos, entonces quizá todas las criaturas emplumadas lo hacen. Este es un tipo de razonamiento muy importante, incluso si el número de observaciones es pequeño (por ejemplo, quemarse una vez con fuego puede ser suficiente para que una persona sea cautelosa por el resto de su vida al manejar este elemento). Sin embargo, la tendencia natural a generalizar también puede extraviar al que lo hace. Caer enfermo el día siguiente de romper un espejo puede ser suficiente para que un individuo tema de por vida a los espejos rotos. En un nivel más refinado, descubrir que varios pacientes que tienen los mismos síntomas se recuperan después de administrarles un nuevo fármaco puede conducir al médico a generalizar que todos los pacientes similares recobrarán la salud usándolo, aun cuando la recuperación sólo haya ocurrido por azar.

La tendencia humana a generalizar tiene algunos aspectos sutiles. Una vez formadas, las generalizaciones suelen influir en las percepciones y las interpretaciones que las personas hacer de los acontecimientos. Por ejemplo, si el médico tiene la generalización de que el fármaco ayudará a todos los pacientes que presentan ciertos síntomas, es probable que interprete el estado del paciente como una mejoría después de que éste ha tomado el medicamento, aun si la mejoría es dudosa. Para evitar tales prejuicios en la investigación, los científicos utilizan comúnmente un procedimiento "ciego", en el cual la persona que observa o interpreta los resultados no es la misma que controla las condiciones (por ejemplo, el médico que juzga el estado del paciente no sabe qué tratamiento específico ha recibido éste).

Mucho del razonamiento, y quizá la mayor parte del pensamiento creativo, implica no sólo la lógica sino las analogías. Cuando una situación parece semejarse a otra en algún aspecto, se puede creer que también se parece a otros. Por ejemplo, la luz que se difunde a partir de una fuente lo hace como las ondas en el agua a partir de una perturbación, quizá por eso la luz actúa como las ondas en el agua en otros aspectos, como producir patrones de interferencia donde se cruzan las ondas (si lo hacen). O el Sol es como el fuego porque produce luz y calor, tal vez por eso implica también quemar combustible (de hecho, no lo hace). El punto importante es que el razonamiento por analogía puede sugerir conclusiones, pero nunca puede probar que son verdaderas.


No comments: