Tendencias21
Una nueva herramienta democratiza la ciencia de datos

Una nueva herramienta democratiza la ciencia de datos

Una nueva herramienta desarrollada en el MIT democratiza el cuarto paradigma de la ciencia, la ciencia de datos: demuestra que los programas probabilísticos se pueden sintetizar automáticamente, en lugar de ser escritos por personas.

Una nueva herramienta democratiza la ciencia de datos

Investigadores del Instituto Tecnológico de Massachusetts (MIT) han desarrollado una herramienta que democratiza el cuarto paradigma de la ciencia, la así llamada ciencia de datos, que unifica la estadística, el análisis de datos y el aprendizaje automático para comprender y analizar los fenómenos reales. Esta nueva ciencia trasciende los métodos tradicionales de análisis de datos al incorporar modelos, ecuaciones, algoritmos, así como la evaluación e interpretación de resultados.​

Uno de los problemas que tiene esta disciplina es que no hay muchos especialistas que puedan modelar bien los datos, lo que limita su aplicación para conocer en profundidad procesos sociales, particularmente en la administración pública.

La nueva herramienta sale al encuentro de esta limitación, ya que está pensada para que personas con poca o nula experiencia puedan generar automáticamente modelos que analicen datos que están sin procesar.

Según informa el MIT en un comunicado, la herramienta sustituye la labor de los especialistas, ya que absorbe conjuntos de datos y genera los modelos estadísticos sofisticados que suelen utilizar los expertos para analizar, interpretar y predecir patrones subyacentes en los datos.

La herramienta está alojada en Jupiter, un espacio web de código abierto que permite a los usuarios ejecutar programas de forma interactiva en sus navegadores. Los usuarios solo necesitan escribir unas pocas líneas de código para descubrir información sobre, por ejemplo, las tendencias financieras, los viajes aéreos, los patrones de votación, la propagación de enfermedades y otras tendencias.

En un artículo presentado en el Simposio ACM SIGPLAN sobre Principios de los lenguajes de programación, los investigadores demuestran que su herramienta puede extraer patrones y realizar predicciones a partir de conjuntos de datos del mundo real, e incluso superar modelos construidos manualmente en ciertas tareas de análisis de datos.

Probabilidad bayesiana

Uno de los principales atributos de esta herramienta es que utiliza la probabilidad bayesiana para la realización de sus estimaciones. A diferencia de otros sistemas, este método estadístico actualiza continuamente la probabilidad de una variable a medida que se dispone de más información sobre esa variable.

Sirve por ejemplo para ir actualizando la previsión inicial de que un candidato gane las elecciones. A medida que surge más información, por ejemplo sobre el desarrollo de la jornada electoral, la probabilidad bayesiana va afinando la previsión inicial sobre la posibilidad de que ese candidato sea finalmente el elegido.

El mismo patrón metodológico puede servir también para predecir la evolución del tráfico de las aerolíneas, y precisar con el tiempo la probabilidad de que en verano podamos tener acceso a un billete de avión para ir a nuestro destino preferido.

También es útil para reforzar la investigación sociológica de un segmento de la población, ya que los modelos bayesianos pueden predecir el salario de una persona en función de su ocupación y lugar de residencia, o determinar si la edad y ocupación de un individuo permiten conocer su nivel de ingresos.

Automatización de procesos

Lo que aporta la nueva herramienta a la probabilidad bayesiana es que automatiza una parte fundamental de su proceso metodológico, ya que el modelado bayesiano suele ser bastante lento y tedioso.

La nueva herramienta sustituye a un profesional estadístico junior o a un científico de datos al responder a preguntas sobre posibles variables de forma automática, a partir de la evolución de los pronósticos iniciales.

Es esta facultad la que permite a la herramienta democratizar el cuarto paradigma de la ciencia, ya que alcanza un nivel de complejidad en el desarrollo de los cálculos sin tener conocimientos previos sobre modelos estadísticos o probabilísticos. La herramienta confirma que los programas probabilísticos se pueden sintetizar a partir de datos, en lugar de ser escritos por personas.

Gracias a esta herramienta, los usuarios escriben una línea de código que detalla la ubicación de los datos en bruto. La herramienta carga esos datos y crea múltiples programas probabilísticos, cada uno de los cuales representa un modelo bayesiano de los datos. Los usuarios pueden elegir sucesivamente qué modelos se adaptan mejor a su aplicación.

Referencia

A Domain Theory for Statistical Probabilistic Programming. Matthijs Vákár, Ohad Kammar, Sam Staton. Distinguished Paper, POPL 2019 Research Papers. DOI:https://doi.org/10.1145/3290349

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Antiguas canoas revelan cómo los marinos del Neolítico surcaron el Mediterráneo 21 marzo, 2024
    Una nueva investigación liderada por Juan Gibaja, del Consejo Nacional de Investigaciones Científicas (CSIC) de España, y publicada recientemente en la revista PLOS One, arroja luz sobre las primeras embarcaciones neolíticas en el Mediterráneo: las excavaciones en el pueblo de agricultores de la Edad de Piedra de La Marmotta, en Italia, han permitido recuperar cinco […]
    Pablo Javier Piacente
  • En los próximos meses, una "nueva estrella" iluminará el cielo nocturno 21 marzo, 2024
    Los científicos de la NASA han informado que durante este año el sistema estelar T Coronae Borealis podrá verse a simple vista en el cielo nocturno, luego de una violenta explosión cósmica que tendrá lugar en algún momento en los próximos seis meses. La “nueva estrella” en el cielo podrá apreciarse sin la ayuda de […]
    Pablo Javier Piacente
  • La Antártida puede perder su neutralidad y su actividad exclusivamente científica 21 marzo, 2024
    El cambio climático y la creciente demanda de recursos está sacudiendo de la Antártida como continente neutral y exclusivamente científico. La rivalidad entre potencias ha comenzado a hacerse presente en las costas antárticas.
    Eduardo Martínez de la Fe
  • Los primeros recuerdos son solo reconstrucciones mentales 21 marzo, 2024
    Lejos de ser grabaciones fidedignas de la realidad, los primeros recuerdos son más bien un mosaico compuesto por experiencias reales, narrativas familiares y reconstrucciones mentales. A medida que crecemos, este mosaico se enriquece y se transforma, pero los fragmentos de nuestra primera infancia permanecen, en gran medida, como piezas imaginadas en un rompecabezas de la […]
    Redacción T21
  • Los vínculos sociales alinean a las personas en la misma longitud de onda 20 marzo, 2024
    El vínculo social mejora el intercambio de información y sincroniza las actividades cerebrales entre el líder de un grupo y sus seguidores, colocando a todo el grupo en la misma longitud de onda cerebral, según un nuevo estudio de sincronización neuronal.
    Pablo Javier Piacente
  • Partículas desconocidas de energía oscura serían la fuerza impulsora detrás de la expansión del Universo 20 marzo, 2024
    Una nueva investigación teórica sugiere que la misteriosa energía oscura estaría compuesta por "no partículas" y podría estar ligada a la expansión del cosmos, "separando" lentamente al Universo. Esto explicaría por qué los científicos no logran comprender aún en profundidad cómo el Universo se expande de forma cada vez más acelerada. También revelaría la causa […]
    Pablo Javier Piacente
  • Las mujeres científicas lideran las investigaciones sobre la sequía 20 marzo, 2024
    Las mujeres científicas están a la vanguardia de las investigaciones sobre la sequía para preservar la producción agrícola, gestionar el agua y mitigar los efectos del calentamiento global. Sobre el terreno, están también mejor preparadas para gestionar los desastres naturales.
    Alicia Domínguez y Eduardo Costas (*)
  • Los robots humanoides llegan a la industria automotriz 20 marzo, 2024
    Mercedes ha contratado robots humanoides para trabajar en sus fábricas: participan en las líneas de ensamblaje y automatizan tareas de baja complejidad y alta exigencia física.
    Redacción T21
  • Revelan cómo nace el miedo en el cerebro y una posible vía para paralizarlo 19 marzo, 2024
    Un nuevo estudio ha logrado descifrar una serie de modificaciones en la química cerebral que, al influir sobre circuitos neuronales específicos, provocan que el miedo se generalice y aparezca en situaciones en las que no debería hacerlo. Este sistema es el que genera la sensación de miedo exacerbada y permanente que experimentan las personas que […]
    Pablo Javier Piacente
  • Crean el mapa 3D más extenso de los agujeros negros supermasivos activos del Universo 19 marzo, 2024
    En una verdadera proeza astronómica, los científicos han creado el mapa más extenso hasta el momento de los agujeros negros supermasivos activos y cuásares en el cosmos: el avance marca un salto significativo en nuestra comprensión de estos gigantes cósmicos y podría ayudar a entender mejor las propiedades de la materia oscura.
    Pablo Javier Piacente