Tendencias21
Una nueva herramienta democratiza la ciencia de datos

Una nueva herramienta democratiza la ciencia de datos

Una nueva herramienta desarrollada en el MIT democratiza el cuarto paradigma de la ciencia, la ciencia de datos: demuestra que los programas probabilísticos se pueden sintetizar automáticamente, en lugar de ser escritos por personas.

Una nueva herramienta democratiza la ciencia de datos

Investigadores del Instituto Tecnológico de Massachusetts (MIT) han desarrollado una herramienta que democratiza el cuarto paradigma de la ciencia, la así llamada ciencia de datos, que unifica la estadística, el análisis de datos y el aprendizaje automático para comprender y analizar los fenómenos reales. Esta nueva ciencia trasciende los métodos tradicionales de análisis de datos al incorporar modelos, ecuaciones, algoritmos, así como la evaluación e interpretación de resultados.​

Uno de los problemas que tiene esta disciplina es que no hay muchos especialistas que puedan modelar bien los datos, lo que limita su aplicación para conocer en profundidad procesos sociales, particularmente en la administración pública.

La nueva herramienta sale al encuentro de esta limitación, ya que está pensada para que personas con poca o nula experiencia puedan generar automáticamente modelos que analicen datos que están sin procesar.

Según informa el MIT en un comunicado, la herramienta sustituye la labor de los especialistas, ya que absorbe conjuntos de datos y genera los modelos estadísticos sofisticados que suelen utilizar los expertos para analizar, interpretar y predecir patrones subyacentes en los datos.

La herramienta está alojada en Jupiter, un espacio web de código abierto que permite a los usuarios ejecutar programas de forma interactiva en sus navegadores. Los usuarios solo necesitan escribir unas pocas líneas de código para descubrir información sobre, por ejemplo, las tendencias financieras, los viajes aéreos, los patrones de votación, la propagación de enfermedades y otras tendencias.

En un artículo presentado en el Simposio ACM SIGPLAN sobre Principios de los lenguajes de programación, los investigadores demuestran que su herramienta puede extraer patrones y realizar predicciones a partir de conjuntos de datos del mundo real, e incluso superar modelos construidos manualmente en ciertas tareas de análisis de datos.

Probabilidad bayesiana

Uno de los principales atributos de esta herramienta es que utiliza la probabilidad bayesiana para la realización de sus estimaciones. A diferencia de otros sistemas, este método estadístico actualiza continuamente la probabilidad de una variable a medida que se dispone de más información sobre esa variable.

Sirve por ejemplo para ir actualizando la previsión inicial de que un candidato gane las elecciones. A medida que surge más información, por ejemplo sobre el desarrollo de la jornada electoral, la probabilidad bayesiana va afinando la previsión inicial sobre la posibilidad de que ese candidato sea finalmente el elegido.

El mismo patrón metodológico puede servir también para predecir la evolución del tráfico de las aerolíneas, y precisar con el tiempo la probabilidad de que en verano podamos tener acceso a un billete de avión para ir a nuestro destino preferido.

También es útil para reforzar la investigación sociológica de un segmento de la población, ya que los modelos bayesianos pueden predecir el salario de una persona en función de su ocupación y lugar de residencia, o determinar si la edad y ocupación de un individuo permiten conocer su nivel de ingresos.

Automatización de procesos

Lo que aporta la nueva herramienta a la probabilidad bayesiana es que automatiza una parte fundamental de su proceso metodológico, ya que el modelado bayesiano suele ser bastante lento y tedioso.

La nueva herramienta sustituye a un profesional estadístico junior o a un científico de datos al responder a preguntas sobre posibles variables de forma automática, a partir de la evolución de los pronósticos iniciales.

Es esta facultad la que permite a la herramienta democratizar el cuarto paradigma de la ciencia, ya que alcanza un nivel de complejidad en el desarrollo de los cálculos sin tener conocimientos previos sobre modelos estadísticos o probabilísticos. La herramienta confirma que los programas probabilísticos se pueden sintetizar a partir de datos, en lugar de ser escritos por personas.

Gracias a esta herramienta, los usuarios escriben una línea de código que detalla la ubicación de los datos en bruto. La herramienta carga esos datos y crea múltiples programas probabilísticos, cada uno de los cuales representa un modelo bayesiano de los datos. Los usuarios pueden elegir sucesivamente qué modelos se adaptan mejor a su aplicación.

Referencia

A Domain Theory for Statistical Probabilistic Programming. Matthijs Vákár, Ohad Kammar, Sam Staton. Distinguished Paper, POPL 2019 Research Papers. DOI:https://doi.org/10.1145/3290349

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • El cambio climático está modificando el cerebro de los animales 17 noviembre, 2024
    Las funciones principales del sistema nervioso, o sea la detección de sentidos, el procesamiento mental y la dirección del comportamiento, son críticas para el desarrollo armónico de la vida en la Tierra. Permiten a los animales navegar en sus entornos para facilitar su supervivencia y reproducción, además de hacer posible un equilibrio armónico entre las […]
    Pablo Javier Piacente
  • El misterio del ordenador más antiguo del mundo 16 noviembre, 2024
    En 1901, un grupo de investigadores descubrió en un naufragio un extraño y rudimentario ordenador, que luego se definió como el mecanismo de Antikythera, un artefacto fechado en el siglo II a.C. que se convirtió en el ordenador más antiguo del mundo y hasta apareció en uno de los films de la saga "Indiana Jones". […]
    Pablo Javier Piacente
  • Piedras de 12.000 años de antigüedad serían la evidencia más antigua del principio mecánico de la rueda 15 noviembre, 2024
    Aunque los arqueólogos ubican la invención formal de la rueda sobre la Edad del Bronce, un nuevo estudio sugiere que este avance podría haberse concretado miles de años antes: el análisis de un conjunto excepcional de más de cien guijarros perforados, descubietos en una aldea de Israel, muestra que estas piedras con 12.000 años de […]
    Pablo Javier Piacente
  • Restauran la visión humana mediante células madre 15 noviembre, 2024
    En un avance vital en el campo de la medicina regenerativa, un trasplante de células madre ha mejorado significativamente la visión de tres personas con daños severos en sus córneas. El ensayo clínico realizado en Japón es el primero en su tipo a nivel mundial, según destacan los investigadores.
    Pablo Javier Piacente
  • La cultura declara también la emergencia climática: así es el movimiento 15 noviembre, 2024
    La cultura mundial se suma al movimiento por la emergencia climática y en España acaba de lanzarse con un manifiesto entre la utopía y la distopía para desafiar las estructuras de poder que ignoran el consenso científico, fracasan en su misión de protegernos y perpetúan el ecocidio.
    Alejandro Sacristán (enviado especial)
  • Crean un arma de rayo de energía inspirada en la Estrella de la Muerte de la saga Star Wars 14 noviembre, 2024
    Científicos chinos afirman haber hecho realidad el arma de haz de energía convergente que utiliza la estación espacial Estrella de la Muerte en la saga Star Wars: el sistema dirige una serie de haces de alta potencia a un solo objetivo. En la práctica, el arma podría tener un impacto letal al permitir desplegar múltiples vehículos […]
    Pablo Javier Piacente
  • Una isla rusa desaparece por completo del mapa en el Ártico 14 noviembre, 2024
    Un grupo de escolares y estudiantes universitarios descubrió que una isla rusa en el Ártico ha desaparecido recientemente, después de comparar imágenes satelitales del área para un proyecto educativo. La Sociedad Geográfica Rusa confirmó la desaparición de la isla helada Mesyatseva, aparentemente como consecuencia de los efectos del calentamiento global y el cambio climático antropogénico.
    Pablo Javier Piacente
  • Descubren cómo nuestro cerebro predice el futuro 14 noviembre, 2024
    El cerebro hace mucho más que procesar información: aprende de experiencias pasadas y hace predicciones sobre el futuro inmediato. Así podemos vivir con seguridad las experiencias cotidianas.
    Redacción T21
  • Descubren una extraña criatura fantasmal desconocida en lo profundo del océano 13 noviembre, 2024
    Un grupo de investigadores ha revelado recientemente una variedad desconocida de nudibranquio, una extraña criatura marina que nada libremente en los mares a más de 2.200 metros de profundidad, iluminada por un brillo bioluminiscente y adornada con una capucha ondulante, que le confieren un aspecto fantasmal. Se trata del primer nudibranquio conocido de su tipo, […]
    Pablo Javier Piacente
  • Nuestros antepasados usaron herramientas hace más de 3 millones de años 13 noviembre, 2024
    Un nuevo estudio que ha analizado los huesos de las manos de australopitecos, simios y humanos revela que el uso de herramientas probablemente evolucionó antes del surgimiento del género Homo: nuestros antepasados homínidos habrían comenzado a dominarlas hace más de 3 millones de años, iniciando una práctica cultural y tecnológica que se creía propia de […]
    Pablo Javier Piacente