Tendencias21
Una nueva herramienta democratiza la ciencia de datos

Una nueva herramienta democratiza la ciencia de datos

Una nueva herramienta desarrollada en el MIT democratiza el cuarto paradigma de la ciencia, la ciencia de datos: demuestra que los programas probabilísticos se pueden sintetizar automáticamente, en lugar de ser escritos por personas.

Una nueva herramienta democratiza la ciencia de datos

Investigadores del Instituto Tecnológico de Massachusetts (MIT) han desarrollado una herramienta que democratiza el cuarto paradigma de la ciencia, la así llamada ciencia de datos, que unifica la estadística, el análisis de datos y el aprendizaje automático para comprender y analizar los fenómenos reales. Esta nueva ciencia trasciende los métodos tradicionales de análisis de datos al incorporar modelos, ecuaciones, algoritmos, así como la evaluación e interpretación de resultados.​

Uno de los problemas que tiene esta disciplina es que no hay muchos especialistas que puedan modelar bien los datos, lo que limita su aplicación para conocer en profundidad procesos sociales, particularmente en la administración pública.

La nueva herramienta sale al encuentro de esta limitación, ya que está pensada para que personas con poca o nula experiencia puedan generar automáticamente modelos que analicen datos que están sin procesar.

Según informa el MIT en un comunicado, la herramienta sustituye la labor de los especialistas, ya que absorbe conjuntos de datos y genera los modelos estadísticos sofisticados que suelen utilizar los expertos para analizar, interpretar y predecir patrones subyacentes en los datos.

La herramienta está alojada en Jupiter, un espacio web de código abierto que permite a los usuarios ejecutar programas de forma interactiva en sus navegadores. Los usuarios solo necesitan escribir unas pocas líneas de código para descubrir información sobre, por ejemplo, las tendencias financieras, los viajes aéreos, los patrones de votación, la propagación de enfermedades y otras tendencias.

En un artículo presentado en el Simposio ACM SIGPLAN sobre Principios de los lenguajes de programación, los investigadores demuestran que su herramienta puede extraer patrones y realizar predicciones a partir de conjuntos de datos del mundo real, e incluso superar modelos construidos manualmente en ciertas tareas de análisis de datos.

Probabilidad bayesiana

Uno de los principales atributos de esta herramienta es que utiliza la probabilidad bayesiana para la realización de sus estimaciones. A diferencia de otros sistemas, este método estadístico actualiza continuamente la probabilidad de una variable a medida que se dispone de más información sobre esa variable.

Sirve por ejemplo para ir actualizando la previsión inicial de que un candidato gane las elecciones. A medida que surge más información, por ejemplo sobre el desarrollo de la jornada electoral, la probabilidad bayesiana va afinando la previsión inicial sobre la posibilidad de que ese candidato sea finalmente el elegido.

El mismo patrón metodológico puede servir también para predecir la evolución del tráfico de las aerolíneas, y precisar con el tiempo la probabilidad de que en verano podamos tener acceso a un billete de avión para ir a nuestro destino preferido.

También es útil para reforzar la investigación sociológica de un segmento de la población, ya que los modelos bayesianos pueden predecir el salario de una persona en función de su ocupación y lugar de residencia, o determinar si la edad y ocupación de un individuo permiten conocer su nivel de ingresos.

Automatización de procesos

Lo que aporta la nueva herramienta a la probabilidad bayesiana es que automatiza una parte fundamental de su proceso metodológico, ya que el modelado bayesiano suele ser bastante lento y tedioso.

La nueva herramienta sustituye a un profesional estadístico junior o a un científico de datos al responder a preguntas sobre posibles variables de forma automática, a partir de la evolución de los pronósticos iniciales.

Es esta facultad la que permite a la herramienta democratizar el cuarto paradigma de la ciencia, ya que alcanza un nivel de complejidad en el desarrollo de los cálculos sin tener conocimientos previos sobre modelos estadísticos o probabilísticos. La herramienta confirma que los programas probabilísticos se pueden sintetizar a partir de datos, en lugar de ser escritos por personas.

Gracias a esta herramienta, los usuarios escriben una línea de código que detalla la ubicación de los datos en bruto. La herramienta carga esos datos y crea múltiples programas probabilísticos, cada uno de los cuales representa un modelo bayesiano de los datos. Los usuarios pueden elegir sucesivamente qué modelos se adaptan mejor a su aplicación.

Referencia

A Domain Theory for Statistical Probabilistic Programming. Matthijs Vákár, Ohad Kammar, Sam Staton. Distinguished Paper, POPL 2019 Research Papers. DOI:https://doi.org/10.1145/3290349

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Descubren una firme y alarmante relación entre las bebidas azucaradas y el cáncer 25 marzo, 2025
    Un nuevo estudio ha hallado un vínculo alarmante entre las bebidas azucaradas y el cáncer oral: los científicos de la Universidad de Washington descubrieron que las mujeres que beben al menos un refresco azucarado por día parecen tener aproximadamente cinco veces más probabilidades de contraer cáncer de cavidad oral (OCC) que las mujeres que evitan […]
    Pablo Javier Piacente / T21
  • Elon Musk y Neuralink ya están patentando una aplicación de "telepatía" 25 marzo, 2025
    En los últimos meses, Elon Musk y su equipo en Neuralink se han referido a las capacidades del chip de interfaz cerebral de la compañía, The Link, como “Telepatía”. Neuralink incluso ha presentado una solicitud de marca comercial ante los organismos oficiales estadounidenses para reservar los nombres “Telepatía” y “Telekinesis”. ¿Ya tiene Neuralink el secreto […]
    Pablo Javier Piacente / T21
  • Desarrollan la pantalla LED más pequeña del mundo: tiene el tamaño de un virus 25 marzo, 2025
    Investigadores de la Universidad de Zhejiang en Hangzhou, China, en colaboración con la Universidad de Cambridge, han creado una pantalla LED con píxeles que miden solo 90 nanómetros de ancho, un tamaño comparable al de los virus típicos. 
    Redacción T21
  • La revolución de la inteligencia artificial: ¿la era del fin del trabajo humano? 25 marzo, 2025
    La IA ha cruzado un umbral crítico: pronto podríamos ver sistemas autónomos capaces de realizar tareas humanas complejas, de semanas de duración, realizadas en apenas horas, cambiando para siempre el mercado laboral y la sociedad.
    Redacción T21
  • ¿Por qué no recordamos nada de cuando éramos bebés? 25 marzo, 2025
    El enigma de la memoria infantil parece comenzar a resolverse: una nueva investigación muestra que los bebés pueden codificar recuerdos específicos, sugiriendo que la “amnesia infantil” que nos impide recordar la etapa más temprana de la vida podría ser un problema de recuperación de memoria.
    Redacción T21
  • Todos los robots en todas partes: la era de la robótica generalista ha llegado 25 marzo, 2025
    Nos dirigimos a pasos acelerados a un mundo en el que conviviremos y seremos asistidos por robots humanoides E-AGI, que se ocuparán de muchas de las tareas de trabajadores humanos. Será un reto para nuestro actual sistema legislativo, policial y jurídico.
    Alejandro Sacristán
  • Los humanos modernos provienen de una combinación de linajes genéticos 24 marzo, 2025
    Una nueva investigación muestra que nuestros orígenes evolutivos son más complejos de lo pensado y no provienen de un único linaje, involucrando diferentes grupos que se desarrollaron por separado durante más de un millón de años, y luego se combinaron para formar la especie humana moderna.
    Pablo Javier Piacente / T21
  • Describen cómo el uso de ChatGPT afecta el bienestar emocional de las personas 24 marzo, 2025
    Dos nuevos estudios de OpenAI nos permiten tener una mejor idea de cómo los chatbots nos están afectando, aunque todavía hay mucho que no sabemos: los investigadores confirmaron que solo un pequeño subconjunto de usuarios interactúa emocionalmente con ChatGPT. También hallaron diferencias en el impacto que genera en cada persona, identificando dependencia emocional y cierta […]
    Pablo Javier Piacente / T21
  • La Universidad de Columbia acata la injerencia de Trump para no perder fondos federales 24 marzo, 2025
    La Universidad de Columbia ha aceptado injerencias políticas en el diseño de contenidos académicos y cercenar la libertad de manifestación en el campus, todo ello para no perder fondos federales. Medio centenar de universidades de Estados Unidos están también amenazadas de intervención.
    EDUARDO MARTÍNEZ DE LA FE/T21
  • Un truco mental reduce realmente el dolor 24 marzo, 2025
    Un estudio ha demostrado que la conocida “ilusión de la mano de goma” puede reducir significativamente la percepción del dolor. Los investigadores sugieren que la ilusión sobre una extremidad artificial puede alterar la percepción del dolor en tiempo real, proporcionando implicaciones potenciales para nuevas terapias.
    Redacción T21