Tendencias21
Una nueva herramienta democratiza la ciencia de datos

Una nueva herramienta democratiza la ciencia de datos

Una nueva herramienta desarrollada en el MIT democratiza el cuarto paradigma de la ciencia, la ciencia de datos: demuestra que los programas probabilísticos se pueden sintetizar automáticamente, en lugar de ser escritos por personas.

Una nueva herramienta democratiza la ciencia de datos

Investigadores del Instituto Tecnológico de Massachusetts (MIT) han desarrollado una herramienta que democratiza el cuarto paradigma de la ciencia, la así llamada ciencia de datos, que unifica la estadística, el análisis de datos y el aprendizaje automático para comprender y analizar los fenómenos reales. Esta nueva ciencia trasciende los métodos tradicionales de análisis de datos al incorporar modelos, ecuaciones, algoritmos, así como la evaluación e interpretación de resultados.​

Uno de los problemas que tiene esta disciplina es que no hay muchos especialistas que puedan modelar bien los datos, lo que limita su aplicación para conocer en profundidad procesos sociales, particularmente en la administración pública.

La nueva herramienta sale al encuentro de esta limitación, ya que está pensada para que personas con poca o nula experiencia puedan generar automáticamente modelos que analicen datos que están sin procesar.

Según informa el MIT en un comunicado, la herramienta sustituye la labor de los especialistas, ya que absorbe conjuntos de datos y genera los modelos estadísticos sofisticados que suelen utilizar los expertos para analizar, interpretar y predecir patrones subyacentes en los datos.

La herramienta está alojada en Jupiter, un espacio web de código abierto que permite a los usuarios ejecutar programas de forma interactiva en sus navegadores. Los usuarios solo necesitan escribir unas pocas líneas de código para descubrir información sobre, por ejemplo, las tendencias financieras, los viajes aéreos, los patrones de votación, la propagación de enfermedades y otras tendencias.

En un artículo presentado en el Simposio ACM SIGPLAN sobre Principios de los lenguajes de programación, los investigadores demuestran que su herramienta puede extraer patrones y realizar predicciones a partir de conjuntos de datos del mundo real, e incluso superar modelos construidos manualmente en ciertas tareas de análisis de datos.

Probabilidad bayesiana

Uno de los principales atributos de esta herramienta es que utiliza la probabilidad bayesiana para la realización de sus estimaciones. A diferencia de otros sistemas, este método estadístico actualiza continuamente la probabilidad de una variable a medida que se dispone de más información sobre esa variable.

Sirve por ejemplo para ir actualizando la previsión inicial de que un candidato gane las elecciones. A medida que surge más información, por ejemplo sobre el desarrollo de la jornada electoral, la probabilidad bayesiana va afinando la previsión inicial sobre la posibilidad de que ese candidato sea finalmente el elegido.

El mismo patrón metodológico puede servir también para predecir la evolución del tráfico de las aerolíneas, y precisar con el tiempo la probabilidad de que en verano podamos tener acceso a un billete de avión para ir a nuestro destino preferido.

También es útil para reforzar la investigación sociológica de un segmento de la población, ya que los modelos bayesianos pueden predecir el salario de una persona en función de su ocupación y lugar de residencia, o determinar si la edad y ocupación de un individuo permiten conocer su nivel de ingresos.

Automatización de procesos

Lo que aporta la nueva herramienta a la probabilidad bayesiana es que automatiza una parte fundamental de su proceso metodológico, ya que el modelado bayesiano suele ser bastante lento y tedioso.

La nueva herramienta sustituye a un profesional estadístico junior o a un científico de datos al responder a preguntas sobre posibles variables de forma automática, a partir de la evolución de los pronósticos iniciales.

Es esta facultad la que permite a la herramienta democratizar el cuarto paradigma de la ciencia, ya que alcanza un nivel de complejidad en el desarrollo de los cálculos sin tener conocimientos previos sobre modelos estadísticos o probabilísticos. La herramienta confirma que los programas probabilísticos se pueden sintetizar a partir de datos, en lugar de ser escritos por personas.

Gracias a esta herramienta, los usuarios escriben una línea de código que detalla la ubicación de los datos en bruto. La herramienta carga esos datos y crea múltiples programas probabilísticos, cada uno de los cuales representa un modelo bayesiano de los datos. Los usuarios pueden elegir sucesivamente qué modelos se adaptan mejor a su aplicación.

Referencia

A Domain Theory for Statistical Probabilistic Programming. Matthijs Vákár, Ohad Kammar, Sam Staton. Distinguished Paper, POPL 2019 Research Papers. DOI:https://doi.org/10.1145/3290349

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Una revolucionaria mano biónica se fusiona directamente con el cuerpo humano 30 junio, 2024
    Una nueva mano biónica desarrollada por un grupo de investigadores se basa en una tecnología revolucionaria, capaz de conectar directamente la prótesis robótica a los huesos, músculos y nervios del usuario. Esto permite crear una interfaz humano-máquina, que facilita a la Inteligencia Artificial (IA) la traducción de señales cerebrales en movimientos simples pero precisos.
    Pablo Javier Piacente
  • Un proyecto global trabaja para crear de forma colaborativa un cerebro robótico general 29 junio, 2024
    El auge de la inteligencia artificial generativa impulsa un proyecto global que trabaja para crear un cerebro robótico general, capaz de generar androides como los que hemos visto hasta ahora solo en la ciencia ficción. Pero es cuestión de tiempo que convivamos con ellos en perfecta armonía. Ya no es una utopía.
    Eduardo Martínez de la Fe
  • Las hormigas invasoras hacen autostop para encontrar un nuevo hogar 28 junio, 2024
    Se sabe que los insectos son especialistas en utilizar todo tipo de formas de transporte para atravesar amplias distancias, pero un nuevo estudio ha revelado que las hormigas también dominan el autostop: estos insectos sociales recogen a toda la familia, incluida su reina, y se suben al primer vehículo que encuentran para emprender un viaje […]
    Pablo Javier Piacente
  • Los recuerdos imborrables se adhieren a algunas neuronas 28 junio, 2024
    Los científicos han descubierto una explicación biológica para los recuerdos a largo plazo, esos que acompañan a una persona prácticamente durante toda la vida. Revelaron que una molécula, KIBRA, sirve como “pegamento” para otras moléculas, consolidando así la formación de la memoria al activar y mantener una etiqueta sináptica persistente, que queda adherida a un […]
    Pablo Javier Piacente
  • Descubren un boquete de seguridad que afecta a todos los dispositivos y conexiones a Internet 28 junio, 2024
    Una vulnerabilidad de seguridad, que afecta a todas las conexiones y dispositivos de Internet, puede eludir firewalls, VPN y otras herramientas de seguridad y permite espiar a cualquier persona, sin necesidad de código malicioso o acceso al dispositivo. No existe una manera fácil de solucionar este problema de seguridad.
    Redacción T21
  • Crean bebés digitales para mejorar la atención sanitaria 27 junio, 2024
    Un equipo de investigadores desarrolló modelos informáticos que simulan los procesos metabólicos únicos de cada bebé: los “gemelos digitales” pueden ayudar a comprender mejor las enfermedades metabólicas raras y otros desafíos que enfrentan los bebés humanos durante los primeros 6 meses de vida, que son críticos para su crecimiento posterior.
    Pablo Javier Piacente
  • La similitud de los vientos espaciales con los de la Tierra 27 junio, 2024
    Los científicos han descubierto corrientes en el espacio que reflejan de manera inquietante los vientos que giran cerca de la superficie de la Tierra, lo que sugiere fuerzas ocultas que los conectan. Este nuevo conocimiento podría proporcionarnos una mejor comprensión de los sistemas ambientales que circulan alrededor del globo y mejorar los pronósticos meteorológicos espaciales […]
    Pablo Javier Piacente
  • Los archivos geológicos anticipan nuestro futuro climático 27 junio, 2024
    Hace 56 millones de años, la erosión del suelo se cuadruplicó en el planeta debido a las fuertes lluvias y las inundaciones de los ríos provocadas por un calentamiento global muy similar al que conocemos hoy.
    Eduardo Martínez de la Fe
  • Ya es posible transmitir el tacto a través de Internet 26 junio, 2024
    Un nuevo estándar para la compresión y transmisión del sentido del tacto mediante Internet sienta las bases para la telecirugía, la teleconducción y nuevas experiencias de juego en línea, entre otras aplicaciones. El flamante estándar HCTI (Haptic Codecs for the Tactile Internet) es para el “tacto digital” lo que son JPEG, MP3 y MPEG para […]
    Pablo Javier Piacente
  • Las primeras muestras de la cara oculta de la Luna ya están en la Tierra 26 junio, 2024
    La cápsula de reingreso de la sonda Chang'e-6 de China, que transporta hasta dos kilogramos de materiales extraídos y perforados de la cuenca más antigua de la Luna ubicada en su lado oscuro, aterrizó este martes 25 de junio en la región de Mongolia Interior y fue rápidamente recuperada, según informó la Administración Nacional del […]
    Pablo Javier Piacente