#meetingdata October, 18-20, 2018 – UFSCar   

The preliminary schedule is (it may have minor changes):
[The talks will be in Portuguese.]

The Program and Abstracts Book is avaliable here.

Opening Conference: AutoML: Automated Machine Learning
André Carlos Ponce de Leon Ferreira de Carvalho
ICMC–USP

As the number of successful applications of Machine Learning algorithms grows, there is also an increase in the need to make these algorithms easily accessible by users without Machine Learning expertise. There have been several efforts in this direction, involving not only the recommendation of the most suitable algorithm, but also their most appropriate hyper-parameter values. These several efforts started a new research area, named Automated Machine Learning, AutoML, which has attracted the attention of researchers and practitioners not only from the academia, but also from several companies working with data science. This talk will present the main approaches and recent advances in this area, covering also works carried out in the Analytics Laboratory, at USP São Carlos.


Conference 1: Reconstruindo modelos de crédito e segmentação com dados de celulares
Otávio Vasques
Serasa Experian – IF-USP

Como dados provenientes de aparelhos celulares auxiliam a desenvolver modelos de crédito e segmentação de marketing? Discutimos os desafios e soluções para coletar e produzir modelos a partir de variáveis provenientes de aparelhos de celular, aplicativos, localização, etc.


Conference 2: Como nosso cérebro representa o tempo
Estevão Vieira
Serasa Experian – UFABC

Um problema discutido em neurociência é como os nossos cérebros representam o mundo externo (ou conceitos internos). Apresentamos algumas técnicas de aprendizado de máquina para medir a representação de tempo no cérebro, a partir da atividade de neurônios durante a realização de uma tarefa dependente do tempo, encontrando que regiões do cérebro mudam sua representação através de repetições da tarefa.


Conference 3: Aprendizado de máquina sob a influência de covariate-shift
Igor Braga
Big Data

Covariate-shift acontece quando as bases de treinamento e de teste não compartilham a mesma distribuição das variáveis de entrada. Esse fenômeno está presente em diversos problemas de mundo real e, potencialmente, quando a distribuição de teste está sob o controle de terceiros. Nesta palestra, mostramos como covariate-shift prejudica o desempenho dos modelos aprendidos, e abordamos técnicas para detectar e tratar esse problema.


Conference 4: Data Science & Data Engineering aplicados ao mercado de capitais Brasileiro
Rafael Monteiro
Serasa Experian – Mackenzie

Apresentamos como tratar as dezenas de gigabytes de dados gerados por dia, provenientes da bolsa de valores (em tempo real), utilizando o algoritmo de Long Term Short Memory Networks (LSTM) para identificação de padrões e análises.


Conference 5: Estimadores regularizados para ​problemas em ​altas dimensões.
Florencia Leonardi
IME–USP

Nesta palestra serão apresentados alguns problemas típicos de estimação em altas dimensões, como o caso de modelos de regressão linear com mais variáveis que observações ou de modelos gráficos onde o número de vértices é maior que o tamanho da amostra. Introduziremos estimadores do tipo LASSO com regularização baseada na norma l1, e explicaremos quais são as vantagens deste tipo de proposta. Além da exposição teórica, apresentar​e​mos alguns exemplos de aplicação.


Conference 6: Aplicações de machine learning em saúde
Alexandre Dias Porto Chiavegatto Filho
FSP–USP

O rápido aumento na quantidade de dados tem aberto novas oportunidades para a saúde brasileira. Entre as várias novidades proporcionadas pelo big data, destaca-se o uso de modelos preditivos de machine learning para melhorar a qualidade e a avaliação dos serviços de saúde. A palestra tem como objetivo apresentar aplicações práticas desses modelos na área da saúde, além de seus benefícios e limitações.


Closure Conference: FlexCode: modelando incertezas em problemas de predição
Rafael Izbicki
UFSCar

Grande parte das ferramentas de aprendizado de máquina tem como objetivo criar boas predições. Contudo, raramente é possível fazê-las com 100% de acurácia. Assim, em muitas aplicações, apenas fornecer predições não explora toda a informação presente nos dados. Nesta apresentação, mostraremos uma ferramenta que é capaz de modelar incertezas em problemas de predição. Também mostraremos seu desempenho na predição da geolocalização de tweets, assim como para diversos problemas de cosmologia.

Promotion and Support:
UFSCar   DATAScience UFSCar   Serasa Experian   FAPESP   PET-Estatistica   GIS