Seminario de Probabilidad y Estadística
Viernes
10:30hs
-
Salón de seminarios del piso 14, CMAT
Contacto: Alejandro Cholaquidis
(acholaquidis@hotmail.com)
Próximas Charlas
Charlas Anteriores
Dia | 2024-12-06 10:30:00-03:00 |
Hora | 2024-12-06 10:30:00-03:00 |
Lugar | Facultad de Ingeniería, salón 703. |
Two statistical problems for multivariate mixture distributions
Ricardo Fraiman (Udelar)
se adjunta pdf
Dia | 2024-11-29 10:30:00-03:00 |
Hora | 2024-11-29 10:30:00-03:00 |
Lugar | Facultad de Ingeniería, salón 703. |
Exploración en Aprendizaje por Refuerzo con recompensas esparzas.
Ernesto Garcia (Udelar)
Con el avance y la proliferación de algoritmos de aprendizaje por refuerzo (RL), la etapa de exploración se identifica como una gran limitación, en gran medida debido al desconocimiento previo del espacio de estados u otras particularidades del proceso (de Markov) subyacente.
En este contexto, un agente inicia el recorrido del espacio de estados, posiblemente de forma aleatoria al principio, y gradualmente construye un modelo del paisaje de recompensas (o castigos) que se va encontrando en el camino. En entornos con recompensas frecuentes, existen múltiples métodos de estimación que permiten evaluar la política utilizada y así ponderar las trayectorias según su costo energético de manera eficiente. Sin embargo, en escenarios con recompensas escasas o esparzas, las regiones visitadas con frecuencia a menudo no aportan información, lo que dificulta significativamente la exploración eficiente y a la postre el aprendizaje.
En esta charla voy a introducir muy brevemente los ingredientes básicos de un algoritmo de RL (los conceptos en itálica) y pensando en recompensas esparzas, algunas estrategias para sacar a un proceso de Markov de su zona de confort: exploración con un sistema de agentes (o partículas) independientes y una aproximación de la dinámica de Fleming-Viot.
Esta charla se basa en un trabajo aún en curso con Paola Bermolen, Matthieu Jonckheere y Seva Shneer en el marco de mi doctorado.
Esta charla se basa en un trabajo aún en curso con Paola Bermolen, Matthieu Jonckheere y Seva Shneer en el marco de mi doctorado.
Dia | 2024-11-22 10:30:00-03:00 |
Hora | 2024-11-22 10:30:00-03:00 |
Lugar | Facultad de Ingeniería, salón 703. |
Algunos problemas en Teoría de Respuesta al Ítem
Laura Aspirot (Udelar)
En la Teoría de Respuesta al Ítem (TRI) se considera una habilidad o rasgo latente, por ejemplo habilidades en matemática, lectura, o características de la personalidad, que es no observable y se busca medirla mediante diferentes ítems que se preguntan a las personas. La TRI establece un modelo para la probabilidad de que una persona con determinada habilidad responda de cierta manera un ítem (por ejemplo de forma correcta o incorrecta), describiendo así una probabilidad para cada ítem en función de la habilidad. Estos modelos pueden ser unidimensionales o multidimensionales y la mayoría de los enfoques son paramétricos. En la charla voy a presentar distintos modelos de TRI, con foco en los modelos no paramétricos, y a partir de eso contar algunos problemas en los que estamos trabajando en el NIMEE (Núcleo de Investigación, Medición y Evaluación Educativa).
Dia | 2024-11-15 10:30:00-03:00 |
Hora | 2024-11-15 10:30:00-03:00 |
Lugar | Facultad de Ingeniería, salón 703. |
Pruebas de uniformidad (y normalidad) multivariantes
Enrique Cabaña (Udelar)
Se adjunta en en .pdf
Dia | 2024-11-08 10:30:00-03:00 |
Hora | 2024-11-08 10:30:00-03:00 |
Lugar | Lugar: Facultad de Ingeniería, salón 703. En general habrá transmisión virtual. |
Clasificación de Conectomas Basado en el Análisis Mediante Redes Neuronales en Grafos.
Martín Schmidt ((IMERL, Udelar).)
Resumen:El cerebro ha sido objeto de numerosas investigaciones debido a su importancia crítica en los procesos cognitivos y emocionales, así como en la comprensión del ser humano y sus comportamientos. Con el avance de técnicas de resonancia magnética, el análisis de estas conexiones, representadas como conectomas, ha ganado relevancia. Este estudio aborda la clasificación de género a partir de conectomas, alcanzando un 94% de accuracy utilizando Redes Neuronales en Grafos mediante una arquitectura de encoder-decoder con una doble función de costo: reconstrucción del grafo funcional a partir del estructural y clasificación, que fueron complementadas con técnicas de contrastive learning. Asimismo, dado que es un problema de clasificación de grafos sin señal, se estudiaron distintos embeddings espectrales para utilizar como señal en los grafos y se comparó con la opción más utilizada en la literatura, el one-hot encoding. Finalmente, se propuso una herramienta de interpretabilidad inspirada en CAM (Class Activation Mapping) que permite reflejar las decisiones de la red en áreas específicas del cerebro, facilitando la comprensión de los patrones utilizados para la clasificación.
Lugar: la charla será presencial en el salón 703 de FING.
Dia | 2024-10-18 10:30:00-03:00 |
Hora | 2024-10-18 10:30:00-03:00 |
Lugar | Salón 703 de FING. |
Optimización y operación dinámica de sistemas distribuidos de recarga de vehículos eléctricos.
Fernando Paganini (Universidad ORT Uruguay)
Analizamos primero el problema estático de cobertura de una demanda distribuida en el plano a partir de un conjunto de estaciones distribuidas. Este problema puede pensarse a través del clásico transporte óptimo de Monge-Kantorovich; aparecen distintas preguntas que se pueden responder a través de diferentes problemas de optimización.
Dia | 2024-07-05 10:30:00-03:00 |
Hora | 2024-07-05 10:30:00-03:00 |
Lugar | Salón 703. Facultad de Ingeniería. |
Load balancing in networks
Diego Goldsztajn (Inria, Francia)
El siguiente modelo ha sido ampliamente usado para estudiar el tiempo de procesamiento en sistemas como data centers y plataformas de cloud computing. Las tareas que llegan al sistema deben ser asignadas a uno de varios servidores en forma inmediata e irrevocable, y cada servidor procesa las tareas que le fueron asignadas en orden de llegada; en general las tareas llegan de acuerdo a un proceso de Poisson y tienen duraciones exponenciales, por lo que las cantidades de tareas en los servidores evolucionan como una cadena de Markov. Varias políticas de distribución de tareas (load balancing) han sido analizadas con éxito en distintos regímenes asintóticos. Una de las claves de este éxito ha sido la simetría del modelo, en el que dos servidores con la misma cantidad de tareas son intercambiables. Presentaremos resultados para modelos donde hay varios tipos de tareas y un grafo determina para cada tipo cuáles son los servidores compatibles, rompiendo la simetría antes mencionada. Estos modelos están motivados por la distribución heterogénea de datos y modelos de machine learning entre los servidores de data centers y plataformas de cloud computing.
Dia | 2024-06-28 10:30:00-03:00 |
Hora | 2024-06-28 10:30:00-03:00 |
Lugar | Facultad de Ingeniería, salón 703. |
Weighted Random Dot Product Graphs.
Bernardo Marenco (IMERL)
El modelo Random Dot Product Graph (RDPG) es un modelo generativo para datos relacionales, que incluye como casos particulares al Erdös-Rényi y al stochastic block model. Este modelo postula la existencia de posiciones latentes para cada vértice y especifica las probabilidades de formación de aristas mediante el producto interno de los vectores latentes correspondientes. En el marco de mi tesis de doctorado, junto a mis tutores y otros colegas propusimos una extensión del modelo RDPG para tener en cuenta grafos cuyas aristas tengan pesos. En nuestra extensión (llamada weighted RDPG o WRDPG), cada nodo tiene asociada una secuencia de vectores latentes que define la función generatriz de momentos de la distribución de pesos. Específicamente, dado un par de vértices, nuestro modelo postula que el k-ésimo momento de la distribución del peso de la arista que los une está dado por el producto interno entre los k-ésimos elementos de las correspondientes secuencias de posiciones latentes. En la charla voy a contarles cómo es posible recuperar de forma consistente las posiciones latentes a partir de un grafo observado mediante la descomposición espectral de (transformaciones de) la matriz de adyacencia del grafo. Además, contaré cómo el WRDPG puede usarse como un modelo generativo. Este es un trabajo en conjunto con Paola Bermolen, Marcelo Fiori, Federico La Rocca y Gonzalo Mateos.
Dia | 2024-06-21 10:30:00-03:00 |
Hora | 2024-06-21 10:30:00-03:00 |
Lugar | Facultad de Ingeniería, salón 703. |
Bandits con políticas óptimas mixtas
Matias Carrasco (ORT-IMERL)
Voy a presentar un trabajo en curso que estamos llevando a cabo junto a Ricardo Fraiman y Alejandro Cholaquidis.
Informalmente un Stochastic Multi-Armed Bandit (SMAB) consiste en una colección finita de acciones (también llamadas brazos) que al ser tomadas devuelven una recompensa aleatoria con distribución fija (dependiente solamente de la acción elegida). El objetivo general es definir a través de algún mecanismo una manera de tomar acciones de forma secuencial (política) que permita encontrar a largo plazo la mejor acción (mejores recompensas). Dependiendo del significado preciso de "mejor acción" puede ocurrir que las políticas óptimas sean mixtas, esto es, una distribución no trivial en el conjunto de acciones. En la charla voy a revisitar el universo clásico de los SMAB y algunos algoritmos conocidos. Luego pasaré a presentar el marco general en el cual estamos trabajando y una forma de enunciar el Gradient Bandit Algorithm utilizando la Influence Curve de un estimador que se adapta bien a dicho marco.
Dia | 2024-06-07 10:30:00-03:00 |
Hora | 2024-06-07 10:30:00-03:00 |
Lugar | Salón 703. Facultad de Ingeniería. |
Como mezclar una baraja? Representaciones de grupo en probabilidad y estadística. Conferencista: Mauricio Velasco
Mauricio Velasco (UCU)
En esta charla hablaré sobre el rol fundamental de la teoría de representaciones de grupos en el estudio cuantitativo de cadenas de Markov. Estas ideas nos permitirán resolver problemas muy diversos: desde cómo barajar cartas eficientemente hasta cómo simular (y aprender) distribuciones de probabilidad sobre grupos finitos. La charla será autocontenida y no asumirá conocimiento previo ni de teoría de representaciones ni de cadenas de Markov. En la parte final de la charla presentaré trabajo reciente con Elvira Moreno generalizando estas ideas al contexto de espacios homogéneos, de mucho interés en aplicaciones.
Dia | 2024-05-31 10:30:00-03:00 |
Hora | 2024-05-31 10:30:00-03:00 |
Lugar | Salón 703. Facultad de Ingeniería. |
Distribuciones de puntos en la esfera y su energía logarítmica:
Federico Carrasco (Udelar)
En esta charla presentaremos distintas maneras de distribuir puntos aleatorios en la esfera y como se vinculan con el problema 7 de Smale
Dia | 2024-05-24 10:30:00-03:00 |
Hora | 2024-05-24 10:30:00-03:00 |
Lugar | Salón 703. Facultad de Ingeniería. |
Hierarchical Geometric Cluster Detection
Ignacio Ramírez Paulino (Udelar)
This work describes a general method for the detection of affine structures in a set of elements that belong to a certain ambient space. The general idea is that such structures express themselves as unusual concentrations of subsets of such elements around these structures, as opposed to being randomly scattered throughout the space. Whereas existing detection methods assume a global uniform point process over the whole data range as the background model, our method constructs a local background model in the vicinity of the structure, which enables a more precise and versatile detection scheme.
Since the size (scale) of the local analysis region is a key element in the detection, we develop a multi-scale extension of the aforementioned idea. The results are shown on various synthetic datasets.
Dia | 2024-05-17 10:30:00-03:00 |
Hora | 2024-05-17 10:30:00-03:00 |
Lugar | Salón 703. Facultad de Ingeniería. |
Estimadores por extensiones armónicas para detección de comunidades
Nicolás Agote (Universidad de Buenos Aires, Argentina)
Un modelo estocástico de bloques (SBM por su sigla en inglés) es un grafo aleatorio donde los vértices se encuentran divididos en clases, o comunidades, que comparten una etiqueta, y la probabilidad de conexión entre entre pares de vértices está determinada por sus etiquetas. Es uno de los modelos más populares para estudiar el problema de identificación de comunidades, en el que se trata de identificar la etiqueta de los vértices a partir de la observación de una realización del grafo.
En esta charla vamos a repasar algunos resultados fundacionales en la literatura, como la existencia de una transición de fase que determina cuándo es posible identificar las comunidades. Como contribución original, estudiamos los estimadores por extensiones armónicas como posibles enfoques para resolver el problema cuando además se conoce la comunidad de un subconjunto reducido de nodos.
Dia | 2024-05-10 10:30:00-03:00 |
Hora | 2024-05-10 10:30:00-03:00 |
Lugar | virtual, zoom |
Predicción no paramétrica para datos espaciales.
Mariel Guadaluppe Lovatto (Universidad Nacional del Litoral, Argentina)
En el contexto de la predicción de datos espaciales, presentamos cinco predictores no paramétricos basados en la idea del predictor clásico kriging. En esta dirección, los métodos propuestos utilizan una combinación lineal pesada de la variable de interés en sitios donde la misma fue medida, con los pesos calculados utilizando estimadores no paramétricos de tipo núcleo. Los métodos propuestos tratan de explotar al máximo la información dada por la cercanía espacial y también por la similitud entre la variable de interés medida en diferentes vecindarios. Para ello se utilizan distintas combinaciones de núcleos (uno o dos núcleos) y diferentes combinaciones de distancias. El funcionamiento de los métodos propuestos se muestra mediante estudios de simulación y aplicaciones de predicción al precio de la vivienda.
Dia | 2024-05-03 10:30:00-03:00 |
Hora | 2024-05-03 10:30:00-03:00 |
Lugar | Salón 703. Facultad de Ingeniería. |
De la regresión en variedades a la inferencia conformal.
Alejandro Cholaquidis (Udelar)
Las variedades son cruciales para representar fenómenos que no se pueden capturar adecuadamente en espacios euclidianos tradicionales, debido a su curvatura inherente. Esta charla explorará cómo los métodos estadísticos clásicos de regresión deben adaptarse para trabajar en estos espacios, destacando los desafíos de definiciones como la esperanza matemática y, en particular, la esperanza condicional. Se presentarán ejemplos prácticos de datos en variedades y espacios métricos y se dará un teorema de consistencia del método clásico de regresión por k vecinos más cercanos, para el caso en que tanto el imput, X, como el output, Y, pertenecen a una variedad, no necesariamente la misma. Al final de la charla veremos como aplicar este resultado a la inferencia conformal.
Dia | 2024-04-26 10:30:00-03:00 |
Hora | 2024-04-26 10:30:00-03:00 |
Lugar | Salón 703. Facultad de Ingeniería. |
Estimación de likelihood con modelos generativos: Normalizing Flows y Diffusion Models
Matías Tailanian (Udelar)
En esta charla estaré presentando parte de mi trabajo de doctorado, que aborda el desafío de la detección de anomalías en imágenes, con un enfoque en aplicaciones industriales, especialmente en la detección automática de defectos. Como su nombre lo indica, las anomalías representan estructuras fuera de lo común, y por ello su recolección para entrenar modelos resulta difícil, ya que su forma y distribución pueden ser impredecibles. Por lo tanto, se adopta un enfoque "one class", donde se modela la normalidad (y para solo es necesario recolectar muestras normales, que es mucho más sencillo), y las anomalías son detectadas como desviaciones significativas de este modelo. Se presentarán dos métodos para evaluar la "normalidad" de las imágenes, ambos basados en la estimación de la verosimilitud mediante modelos generativos: uno utilizando Normalizing Flows y el otro utilizando Diffusion Models.
Dia | 2024-04-19 10:30:00-03:00 |
Hora | 2024-04-19 10:30:00-03:00 |
Lugar | LA CHARLA SERÁ VIRTUAL |
Penaliza y reinarás
Mariela Sued. (Atención, charla virtual) (UBA)
Dia | 2024-04-12 10:30:00-03:00 |
Hora | 2024-04-12 10:30:00-03:00 |
Lugar | Salón 703. Facultad de Ingeniería. |
Hierarchical Geometric Cluster Detection
Ignacio Ramírez Paulino (Udelar)
This work describes a general method for the detection of affine structures in a set of elements that belong to a certain ambient space. The general idea is that such structures express themselves as unusual concentrations of subsets of such elements around these structures, as opposed to being randomly scattered throughout the space. Whereas existing detection methods assume a global uniform point process over the whole data range as the background model, our method constructs a local background model in the vicinity of the structure, which enables a more precise and versatile detection scheme.
Since the size (scale) of the local analysis region is a key element in the detection, we develop a multi-scale extension of the aforementioned idea. The results are shown on various synthetic datasets.
Dia | 2024-04-05 10:30:00-03:00 |
Hora | 2024-04-05 10:30:00-03:00 |
Lugar | Salón 703. Facultad de Ingeniería. |
El problema de "caching" bajo la lupa de procesos puntuales: intensidad estocástica, política óptima y teoremas límite.
Andrés Ferragut (ORT)
En los sistemas informáticos, el almacenamiento local o "caching" es una estrategia habitual para reducir el tiempo en ofrecer un contenido que es requerido repetidamente. Si bien es un problema clásico, nuevas estrategias de modelado han surgido recientemente utilizando el lenguaje de procesos puntuales en la recta real, en particular procesos de renovación. En este trabajo, conjunto con Matías Carrasco y Fernando Paganini, establecemos un vínculo estrecho entre la intensidad estocástica (noción que definiremos) de dichos procesos y la familia de políticas posibles. Bajo este marco, se identifica claramente la política óptima de almacenamiento. Bajo hipótesis adicionales, se puede establecer el comportamiento asintótico de dicha política mediante una adecuada ley de grandes números, utilizando teoremas límite de distribuciones empíricas para variables no idénticamente distribuidas. Por un lado, esto permite dar una cota universal de la performance de dichos sistemas en el caso asintótico. A su vez permiten interpretar la política óptima en casos particulares de interés: en particular, aparece una dualidad interesante dependiendo de si los tiempos entre pedidos tienen "hazard rate" crecientes o decrecientes.
Dia | 2024-03-22 10:30:00-03:00 |
Hora | 2024-03-22 10:30:00-03:00 |
Lugar | Salón 703. Facultad de Ingeniería. |
Tendencias recientes en modelos de volatilidad
Andres Sosa (Udelar)
En esta presentación, introduciremos las nuevas tendencias de la investigación relacionadas a la volatilidad de las series financieras. La literatura reciente se centra en el concepto de “volatilidad de la volatilidad” (volatility of volatility).
Estas tendencias le asocian la propiedad de presentar estructura “rugosa” (rough volatility) que puede surgir de forma natural de los comportamientos típicos de los participantes en el mercado . Los autores del trabajo pionero son Gatheral, Jaisson, y Rosenbaum en 2018. Posteriormente, varios estudios empíricos sobre una amplia gama de activos de series temporales han demostrado dinámicas más rugosas que la de un movimiento browniano.
Este “hecho estilizado” (stylized fact) refuerza el interés por los modelos basados en ciertos procesos estocásticos como son el movimiento browniano fraccionario y los procesos de Hawks
Dia | 2024-03-15 10:30:00-03:00 |
Hora | 2024-03-15 10:30:00-03:00 |
Lugar | Salón 703. Facultad de Ingeniería. |
Límites de alta dimensionalidad de Modelos Lineales Generalizados Bayesianos
Manuel Saenz (Udelar)
En esta charla, discutiremos resultados recientes sobre los límites de alta dimensionalidad de los Modelos Lineales Generalizados (GLMs) Bayesianos. Nuestros resultados se aplican en particular a regresiones lineales, logísticas, binomiales y multinomiales, en contextos donde las observaciones vienen dadas por vectores gaussianos estándar independientes. Al combinar técnicas para medidas log-cóncavas y métodos provenientes de la Mecánica Estadística, obtenemos una descripción de los límites de alta dimensionalidad correspondientes en términos de ecuaciones de punto fijo. Por medio de estas ecuaciones, determinamos el límite en distribución de conjuntos finitos de coordenadas del estimador bayesiano. Finalmente, exploramos nuestros resultados a través de experimentos numéricos. De esta manera, esperamos ayudar a disminuir la brecha existente entre la teoría estadística y sus aplicaciones prácticas en el análisis de datos a gran escala.