La paradoja de la información y la teoría de Shannon
1.49M views2550 WordsCopy TextShare
Lemnismath
El robo de un banco en 1907, un ladrón que huye a Londres y un problema gordo para atraparlo. Estos ...
Video Transcript:
en 1907 el trabajador de un banco alemán robó el dinero de la caja fuerte y desapareció sin dejar rastro la policía sospechaba que se dirigía al hombres pero les llevaba días de ventaja era inútil enviar la fotografía del ladrón por correo postal porque no llegaría a tiempo para capturarlo con el dinero encima por suerte en esa época ya existía la línea telefónica Pero esto planteaba un problema se puede enviar una imagen por teléfono o sea se puede grabar un audio que permita reconstruir una copia casi exacta de la imagen al escucharlo cuánto duraría se puede inventar un código para que dure menos cuánto Exactamente no es un problema sencillo estamos acostumbrados a comunicarnos con textos imágenes audios y vídeos y sabemos que todos ellos transmiten información pero da la sensación de que son informaciones diferentes que no se pueden transformar entre sí sin embargo en 1948 apareció un artículo que cambió nuestra forma ver el problema la teoría de la información de Shannon desde entonces sabemos que cualquier tipo de mensaje sin importar su formato tiene una cantidad precisa de información que se puede medir usando la misma unidad el bit para calcular la información hay que seguir una fórmula muy extraña pero esa fórmula consigue unificar todos los medios de comunicación Bajo la misma teoría y es muy útil en otras ramas de la ciencia desde los agujeros negros al ADN pero Qué significa esta fórmula Y por qué ha cambiado nuestra manera de entender la comunicación bueno empecemos por el principio [Música] la teoría de la información nació para mejorar el envío de mensajes y una buena forma de verlo es pensar que un mensaje contiene la respuesta a una pregunta que le has hecho a alguien a veces la pregunta tendrá dos respuestas posibles a veces tendrá cientos de respuestas y a veces habrá tantas respuestas como combinaciones de letras te puedas imaginar Eso sí al hacer la pregunta preparas una lista mental con todas las posibles respuestas Y sabes que el contenido del mensaje será una de ellas Shannon pensaba que la información de un mensaje se debía medir como la cantidad de preguntas de sí o no que necesitarías para averiguar Su contenido y a cada respuesta la llamó bit Por ejemplo si un mensaje contiene Cuál es mi planeta favorito del sistema solar sabrás que la respuesta está entre 8 candidatos y Podrías hacerme preguntas para descartar algunos si el nombre de mi planeta termina no no no tiene un aspecto azulado Y sí sí tiene tiene anillos tres preguntas y adivinado y sea cual sea el planeta que elijas al principio siempre lo puedes encontrar con tres preguntas por lo tanto esta información tiene un valor de 3 bits Cuántas preguntas necesitas para encontrar al candidato correcto de una lista Bueno lo más Sensato es hacer preguntas que dividan al grupo por la mitad y puedes hacer preguntas de este estilo hasta que solo te quede una opción la opción correcta el problema Entonces se puede plantear como Cuántas veces puedes dividir por dos el grupo inicial hasta quedarte con un solo candidato y Oye puedes hacer las cuentas a mano pero ya existe una operación para esto el logaritmo en base 2 y sí sé que la palabra logaritmo puede asustar Así que imagínatelo como una tecla en la calculadora una tecla que te dice el número de preguntas que necesitas para quedarte con un solo candidato y de momento Esta es la información que tiene un mensaje por poner ejemplos hay 10. 000 números posibles para el pin de tu tarjeta necesitaría unas 13,3 preguntas para averiguarlo la información de tu pin es de 13,3 bits al escribir un tuit imagina que puedes usar 100 caracteres distintos necesitaría unas 6,6 preguntas para averiguar Cuál es el carácter concreto que quieres usar si el mensaje tiene 280 caracteres Necesito unas 1860 preguntas para averiguarlo o sea 1860 bits de información y lo mismo para una imagen pequeña compuesta de píxeles si cada Pixel puede ser de ocho colores distintos necesito tres preguntas por Pixel y multiplicando lo por el número de píxeles en fin Necesito unas 29. 000 preguntas para averiguar el aspecto exacto de la imagen y esto ya nos enseña Cómo enviar una imagen por teléfono Oye escucha pinta una muestra con ocho tonos de gris el color del primer Pixel está en la parte derecha de la muestra Vale y de los colores que quedan también está a la derecha y de los que quedan sigue a la derecha vale para el color del segundo Pixel está en la parte derecha una vez contestadas toda la información de la imagen estará codificada en estas 28.
800 respuestas con ellas puede reconstruir la imagen original de forma exacta y podrías enviarlas por voz o con puntos y rayas al mandar dos sonidos por segundo la imagen llegaría a Londres en unas 4 horas y Esto fue muy a grandes rasgos lo que pasó en 1907 con ayuda de una máquina en París la policía hizo llegar la imagen a Londres unas horas antes que el ladrón y fue detenido en la misma Estación Esta es la teoría de la información más básica que podemos imaginar cualquier mensaje tiene una cantidad precisa de información que se puede codificar en forma de sí es y no es de puntos y rayas o de ceros y unos Y aunque esta fórmula es muy convincente Shannon advirtió una paradoja muy sutil Y si quisiéramos enviar una fotografía completamente Blanca tendríamos que enviar las 28. 800 respuestas como antes o podríamos decir Oye todos los píxeles son blancos con los dos mensajes podemos recuperar la imagen original Así que contienen la misma información pero Por qué uno es mucho más corto que el otro como se explica resulta que no todas las preguntas de sí o no son iguales a veces dividen al grupo de candidatos por la mitad y a veces a veces no no todas las respuestas nos aportan la misma información Este detalle se puede arreglar diciendo que la información de una respuesta debe tener en cuenta los candidatos que había antes de hacer la pregunta y también los que quedan después de contestarla mira con planetas queda más claro que te digan que el nombre de mi planeta favorito sí acaba en o te hace pasar de 8 candidatos a solo cuatro según la calculadora te aporta un bit de información y los cálculos serían prácticamente los mismos si te contestará que no ahora bien Si te dijera que mi planeta favorito sí tiene koalas pasarías de 8 candidatos a solo uno esa respuesta te aporta a los 3 bits de información de golpe o sea es como si te dijera directamente que he elegido la tierra y antes hubieras necesitado tres preguntas para averiguar esto por eso son tres bits en cambio Si te digo que no tiene koalas seguirás dudando entre 7 candidatos Así que te aporto muy poca información Lo importante es que esta fórmula tiene en cuenta que no todas las respuestas son igual de informativas lo que la hace mucho más versátil además la fórmula está muy relacionada con la probabilidad de las respuestas si eligieras el planeta al azar solo una de cada ocho veces tendría koalas y 7 de cada 8 veces no los tendría estos son los números que hemos introducido en la fórmula de Shannon pero invirtiendo su orden [Música] por eso es frecuente encontrar la fórmula escrita de esta manera y los números cuadran bastante si sabes al 100% Cuál va a ser la respuesta a una pregunta no te aporta información porque ya sabías la respuesta antes de preguntar si la probabilidad de una respuesta es del 50% entonces obtienes un bit de información y Cuanto más improbable sea la respuesta más información te aportará por eso algunos dicen que esta fórmula mide la sorpresa y un pequeño ejemplo con la lotería deja claro por qué si te dicen algo que era poco probable te generan muchas sorpresa y te dan mucha información y cuando te dicen algo que ya te podías imaginar ni es sorprendente ni te aporta Demasiada información y este es el punto clave de Shannon porque en la vida cotidiana los mensajes se agrupan formando estructuras más o menos probables no elegimos el número pin al azar y es probable que alguna vez hayas usado el 1234 Si escribes el Twitter en español sabrás que hay letras mucho más frecuentes que otras y es probable que la que más se repita sea la e y las imágenes no son píxeles distribuidos al azar sino que hay colores más frecuentes que otros en la fotografía del ladrón por ejemplo la mitad de los píxeles son blancos Así que a la hora de preguntar por el color de un Pixel lo mejor es preguntar si es blanco porque la mitad de las veces averiguarás el color con una sola respuesta si te contestarán que no deberías preguntar por el color negro en esta situación la mitad de las veces acertarías el color con Solo dos respuestas a lo que voy es que si conoces la probabilidad de las respuestas puedes organizar mejor tus preguntas con este método cada color necesita una cantidad distinta de preguntas pero los colores que más se repiten son los que menos pregunta requieren y el proceso general es mucho más rápido Cuántas preguntas necesitamos para codificar la fotografía del Ladrón de esta forma Esta es la pregunta del millón solo algunos colores aparecen en la fotografía y cada uno en una proporción distinta como conocemos estas proporciones podemos calcular la sorpresa de cada uno uno de cada dos píxeles es blanco así que nos da una información de un bit o sea lo podemos encontrar haciendo Solo una pregunta el Pixel de color negro es un poco más raro y nos da una información de dos bits porque lo podemos encontrar haciendo dos preguntas en fin cada color necesita un número distinto de preguntas según nos dice la fórmula de la sorpresa y como cada uno necesita un número distinto de preguntas lo mejor es hacer una especie de media ponderada una de cada dos veces necesitaremos Solo una pregunta para adivinar el color del Pixel Porque será blanco una de cada cuatro veces necesitaremos dos preguntas Porque será negro Si contamos todas estas contribuciones veremos que para averiguar el color de un píxel necesitamos de media unas dos preguntas o sea en el primer capítulo necesitábamos 28. 800 preguntas para enviar la información de la imagen y ahora solo 19.
200 por eso la información real de la imagen es de 19.