Seminario de Probabilidad y Estadística

Viernes 10:30hs - Salón de seminarios del piso 14, CMAT

Contacto: Alejandro Cholaquidis (acholaquidis@hotmail.com)

Próximas Charlas

Dia 2024-07-05 10:30:00-03:00
Hora 2024-07-05 10:30:00-03:00
LugarSalón 703. Facultad de Ingeniería.

Load balancing in networks

Diego Goldsztajn (Inria, Francia)

El siguiente modelo ha sido ampliamente usado para estudiar el tiempo de procesamiento en sistemas como data centers y plataformas de cloud computing. Las tareas que llegan al sistema deben ser asignadas a uno de varios servidores en forma inmediata e irrevocable, y cada servidor procesa las tareas que le fueron asignadas en orden de llegada; en general las tareas llegan de acuerdo a un proceso de Poisson y tienen duraciones exponenciales, por lo que las cantidades de tareas en los servidores evolucionan como una cadena de Markov. Varias políticas de distribución de tareas (load balancing) han sido analizadas con éxito en distintos regímenes asintóticos. Una de las claves de este éxito ha sido la simetría del modelo, en el que dos servidores con la misma cantidad de tareas son intercambiables. Presentaremos resultados para modelos donde hay varios tipos de tareas y un grafo determina para cada tipo cuáles son los servidores compatibles, rompiendo la simetría antes mencionada. Estos modelos están motivados por la distribución heterogénea de datos y modelos de machine learning entre los servidores de data centers y plataformas de cloud computing.


Charlas Anteriores

Dia 2024-06-28 10:30:00-03:00
Hora 2024-06-28 10:30:00-03:00
LugarFacultad de Ingeniería, salón 703.

Weighted Random Dot Product Graphs.

Bernardo Marenco (IMERL)

El modelo Random Dot Product Graph (RDPG) es un modelo generativo para datos relacionales, que incluye como casos particulares al Erdös-Rényi y al stochastic block model. Este modelo postula la existencia de posiciones latentes para cada vértice y especifica las probabilidades de formación de aristas mediante el producto interno de los vectores latentes correspondientes. En el marco de mi tesis de doctorado, junto a mis tutores y otros colegas propusimos una extensión del modelo RDPG para tener en cuenta grafos cuyas aristas tengan pesos. En nuestra extensión (llamada weighted RDPG o WRDPG), cada nodo tiene asociada una secuencia de vectores latentes que define la función generatriz de momentos de la distribución de pesos. Específicamente, dado un par de vértices, nuestro modelo postula que el k-ésimo momento de la distribución del peso de la arista que los une está dado por el producto interno entre los k-ésimos elementos de las correspondientes secuencias de posiciones latentes. En la charla voy a contarles cómo es posible recuperar de forma consistente las posiciones latentes a partir de un grafo observado mediante la descomposición espectral de (transformaciones de) la matriz de adyacencia del grafo. Además, contaré cómo el WRDPG puede usarse como un modelo generativo. Este es un trabajo en conjunto con Paola Bermolen, Marcelo Fiori, Federico La Rocca y Gonzalo Mateos.

Dia 2024-06-21 10:30:00-03:00
Hora 2024-06-21 10:30:00-03:00
LugarFacultad de Ingeniería, salón 703.

Bandits con políticas óptimas mixtas

Matias Carrasco (ORT-IMERL)

Voy a presentar un trabajo en curso que estamos llevando a cabo junto a Ricardo Fraiman y Alejandro Cholaquidis.

Informalmente un Stochastic Multi-Armed Bandit (SMAB) consiste en una colección finita de acciones (también llamadas brazos) que al ser tomadas devuelven una recompensa aleatoria con distribución fija (dependiente solamente de la acción elegida). El objetivo general es definir a través de algún mecanismo una manera de tomar acciones de forma secuencial (política) que permita encontrar a largo plazo la mejor acción (mejores recompensas). Dependiendo del significado preciso de "mejor acción" puede ocurrir que las políticas óptimas sean mixtas, esto es, una distribución no trivial en el conjunto de acciones. En la charla voy a revisitar el universo clásico de los SMAB y algunos algoritmos conocidos. Luego pasaré a presentar el marco general en el cual estamos trabajando y una forma de enunciar el Gradient Bandit Algorithm utilizando la Influence Curve de un estimador que se adapta bien a dicho marco.

Dia 2024-06-07 10:30:00-03:00
Hora 2024-06-07 10:30:00-03:00
LugarSalón 703. Facultad de Ingeniería.

Como mezclar una baraja? Representaciones de grupo en probabilidad y estadística. Conferencista: Mauricio Velasco

Mauricio Velasco (UCU)

 En esta charla hablaré sobre el rol fundamental de la teoría de representaciones de grupos en el estudio cuantitativo de cadenas de Markov. Estas ideas nos permitirán resolver problemas muy diversos: desde cómo barajar cartas eficientemente hasta cómo simular (y aprender) distribuciones de probabilidad sobre grupos finitos.  La charla será autocontenida y no asumirá conocimiento previo ni de teoría de representaciones ni de cadenas de Markov. En la parte final de la charla presentaré trabajo reciente con Elvira Moreno generalizando estas ideas al contexto de espacios homogéneos, de mucho interés en aplicaciones.

Dia 2024-05-31 10:30:00-03:00
Hora 2024-05-31 10:30:00-03:00
LugarSalón 703. Facultad de Ingeniería.

Distribuciones de puntos en la esfera y su energía logarítmica:

Federico Carrasco (Udelar)

En esta charla presentaremos distintas maneras de distribuir puntos aleatorios en la esfera y como se vinculan con el problema 7 de Smale

Dia 2024-05-24 10:30:00-03:00
Hora 2024-05-24 10:30:00-03:00
LugarSalón 703. Facultad de Ingeniería.

Hierarchical Geometric Cluster Detection

Ignacio Ramírez Paulino (Udelar)

This work describes a general method for the detection of affine structures in a set of elements that belong to a certain ambient space. The general idea is that such structures express themselves as unusual concentrations of subsets of such elements around these structures, as opposed to being randomly scattered throughout the space. Whereas existing detection methods assume a global uniform point process over the whole data range as the background model, our method constructs a local background model in the vicinity of the structure, which enables a more precise and versatile detection scheme.
Since the size (scale) of the local analysis region is a key element in the detection, we develop a multi-scale extension of the aforementioned idea. The results are shown on various synthetic datasets.

Dia 2024-05-17 10:30:00-03:00
Hora 2024-05-17 10:30:00-03:00
LugarSalón 703. Facultad de Ingeniería.

Estimadores por extensiones armónicas para detección de comunidades

Nicolás Agote (Universidad de Buenos Aires, Argentina)

Un modelo estocástico de bloques (SBM por su sigla en inglés) es un grafo aleatorio donde los vértices se encuentran divididos en clases, o comunidades, que comparten una etiqueta, y la probabilidad de conexión entre entre pares de vértices está determinada por sus etiquetas. Es uno de los modelos más populares para estudiar el problema de identificación de comunidades, en el que se trata de identificar la etiqueta de los vértices a partir de la observación de una realización del grafo.

En esta charla vamos a repasar algunos resultados fundacionales en la literatura, como la existencia de una transición de fase que determina cuándo es posible identificar las comunidades. Como contribución original, estudiamos los estimadores por extensiones armónicas como posibles enfoques para resolver el problema cuando además se conoce la comunidad de un subconjunto reducido de nodos.

Dia 2024-05-10 10:30:00-03:00
Hora 2024-05-10 10:30:00-03:00
Lugarvirtual, zoom

Predicción no paramétrica para datos espaciales.

Mariel Guadaluppe Lovatto (Universidad Nacional del Litoral, Argentina)

En el contexto de la predicción de datos espaciales, presentamos cinco predictores no paramétricos basados en la idea del predictor clásico kriging. En esta dirección, los métodos propuestos utilizan una combinación lineal pesada de la variable de interés en sitios donde la misma fue medida, con los pesos calculados utilizando estimadores no paramétricos de tipo núcleo. Los métodos propuestos tratan de explotar al máximo la información dada por la cercanía espacial y también por la similitud entre la variable de interés medida en diferentes vecindarios. Para ello se utilizan distintas combinaciones de núcleos (uno o dos núcleos) y diferentes combinaciones de distancias. El funcionamiento de los métodos propuestos se muestra mediante estudios de simulación y aplicaciones de predicción al precio de la vivienda. 

Dia 2024-05-03 10:30:00-03:00
Hora 2024-05-03 10:30:00-03:00
LugarSalón 703. Facultad de Ingeniería.

De la regresión en variedades a la inferencia conformal.

Alejandro Cholaquidis (Udelar)

Las variedades son cruciales para representar fenómenos que no se pueden capturar adecuadamente en espacios euclidianos tradicionales, debido a su curvatura inherente. Esta charla explorará cómo los métodos estadísticos clásicos de regresión deben adaptarse para trabajar en estos espacios, destacando los desafíos de definiciones como la esperanza matemática y, en particular, la esperanza condicional. Se presentarán ejemplos prácticos de datos en variedades y espacios métricos y se dará un teorema de consistencia del método clásico de regresión por k vecinos más cercanos, para el caso en que tanto el imput, X, como el output, Y, pertenecen a una variedad, no necesariamente la misma. Al final de la charla veremos como aplicar este resultado a la inferencia conformal.

Dia 2024-04-26 10:30:00-03:00
Hora 2024-04-26 10:30:00-03:00
LugarSalón 703. Facultad de Ingeniería.

Estimación de likelihood con modelos generativos: Normalizing Flows y Diffusion Models

Matías Tailanian (Udelar)

En esta charla estaré presentando parte de mi trabajo de doctorado, que aborda el desafío de la detección de anomalías en imágenes, con un enfoque en aplicaciones industriales, especialmente en la detección automática de defectos. Como su nombre lo indica, las anomalías representan estructuras fuera de lo común, y por ello su recolección para entrenar modelos resulta difícil, ya que su forma y distribución pueden ser impredecibles. Por lo tanto, se adopta un enfoque "one class", donde se modela la normalidad (y para solo es necesario recolectar muestras normales, que es mucho más sencillo), y las anomalías son detectadas como desviaciones significativas de este modelo. Se presentarán dos métodos para evaluar la "normalidad" de las imágenes, ambos basados en la estimación de la verosimilitud mediante modelos generativos: uno utilizando Normalizing Flows y el otro utilizando Diffusion Models.

Dia 2024-04-19 10:30:00-03:00
Hora 2024-04-19 10:30:00-03:00
LugarLA CHARLA SERÁ VIRTUAL

Penaliza y reinarás

Mariela Sued. (Atención, charla virtual) (UBA)

En esta charla presentamos diferentes problemas de selección de modelos y un marco teórico unificado que permite resolver estos y muchos otros problemas interesantes.
Dia 2024-04-12 10:30:00-03:00
Hora 2024-04-12 10:30:00-03:00
LugarSalón 703. Facultad de Ingeniería.

Hierarchical Geometric Cluster Detection

Ignacio Ramírez Paulino (Udelar)

This work describes a general method for the detection of affine structures in a set of elements that belong to a certain ambient space. The general idea is that such structures express themselves as unusual concentrations of subsets of such elements around these structures, as opposed to being randomly scattered throughout the space. Whereas existing detection methods assume a global uniform point process over the whole data range as the background model, our method constructs a local background model in the vicinity of the structure, which enables a more precise and versatile detection scheme.
Since the size (scale) of the local analysis region is a key element in the detection, we develop a multi-scale extension of the aforementioned idea. The results are shown on various synthetic datasets.

Dia 2024-04-05 10:30:00-03:00
Hora 2024-04-05 10:30:00-03:00
LugarSalón 703. Facultad de Ingeniería.

El problema de "caching" bajo la lupa de procesos puntuales: intensidad estocástica, política óptima y teoremas límite.

Andrés Ferragut (ORT)

En los sistemas informáticos, el almacenamiento local o "caching" es una estrategia habitual para reducir el tiempo en ofrecer un contenido que es requerido repetidamente. Si bien es un problema clásico, nuevas estrategias de modelado han surgido recientemente utilizando el lenguaje de procesos puntuales en la recta real, en particular procesos de renovación. En este trabajo, conjunto con Matías Carrasco y Fernando Paganini, establecemos un vínculo estrecho entre la intensidad estocástica (noción que definiremos) de dichos procesos y la familia de políticas posibles. Bajo este marco, se identifica claramente la política óptima de almacenamiento. Bajo hipótesis adicionales, se puede establecer el comportamiento asintótico de dicha política mediante una adecuada ley de grandes números, utilizando teoremas límite de distribuciones empíricas para variables no idénticamente distribuidas. Por un lado, esto permite dar una cota universal de la performance de dichos sistemas en el caso asintótico. A su vez permiten interpretar la política óptima en casos particulares de interés: en particular, aparece una dualidad interesante dependiendo de si los tiempos entre pedidos tienen "hazard rate" crecientes o decrecientes.

Dia 2024-03-22 10:30:00-03:00
Hora 2024-03-22 10:30:00-03:00
LugarSalón 703. Facultad de Ingeniería.

Tendencias recientes en modelos de volatilidad

Andres Sosa (Udelar)

En esta presentación, introduciremos las nuevas tendencias de la investigación relacionadas a la volatilidad de las series financieras. La literatura reciente se centra en el concepto de “volatilidad de la volatilidad” (volatility of volatility).

Estas tendencias le asocian la propiedad de presentar estructura “rugosa” (rough volatility) que puede surgir de forma natural de los comportamientos típicos de los participantes en el mercado . Los autores del trabajo pionero son Gatheral, Jaisson, y Rosenbaum en 2018. Posteriormente, varios estudios empíricos sobre una amplia gama de activos de series temporales han demostrado dinámicas más rugosas que la de un movimiento browniano.

Este “hecho estilizado” (stylized fact) refuerza el interés por los modelos basados en ciertos procesos estocásticos como son el movimiento browniano fraccionario y los procesos de Hawks

Dia 2024-03-15 10:30:00-03:00
Hora 2024-03-15 10:30:00-03:00
LugarSalón 703. Facultad de Ingeniería.

Límites de alta dimensionalidad de Modelos Lineales Generalizados Bayesianos

Manuel Saenz (Udelar)

En esta charla, discutiremos resultados recientes sobre los límites de alta dimensionalidad de los Modelos Lineales Generalizados (GLMs) Bayesianos. Nuestros resultados se aplican en particular a regresiones lineales, logísticas, binomiales y multinomiales, en contextos donde las observaciones vienen dadas por vectores gaussianos estándar independientes. Al combinar técnicas para medidas log-cóncavas y métodos provenientes de la Mecánica Estadística, obtenemos una descripción de los límites de alta dimensionalidad correspondientes en términos de ecuaciones de punto fijo. Por medio de estas ecuaciones, determinamos el límite en distribución de conjuntos finitos de coordenadas del estimador bayesiano. Finalmente, exploramos nuestros resultados a través de experimentos numéricos. De esta manera, esperamos ayudar a disminuir la brecha existente entre la teoría estadística y sus aplicaciones prácticas en el análisis de datos a gran escala.