As palestras são realizadas na Sala de Seminários do IM (Prédio do CT - Bloco C - Sala C-116 - Cidade Universitária)
Data : 27 de novembro de 2009 (6a feira)
Horário : 11:00 às 12:00
Título : "Model-Based Data Mining for Functional Data Under Spatial Interdependence"
Palestrante : Nicoleta Serban (Industrial Systems and Engineering School - Georgia Institute of Technology)
Resumo : In this seminar, I will present data mining methods for discovering and summarizing patterns in functional data observed under spatial interdependence. The field of functional data analysis has already provided a series of competitive data mining approaches, but they are generally limited to the assumption of independence between the random functions. This assumption is rather restrictive in many research applications.
In the first part of this seminar, I will introduce a model-based method for clustering random functions which are spatially interdependent. The time functions are decomposed into spatial global and time-dependent cluster effects using a semi-parametric model. We assume that the clustering membership is a realization from a Markov random field. In the case study presented in this paper, we focus on obtaining temporal cluster trends for racial-ethnic diversity for five southeast states in the US.
In the second part of this seminar, I will introduce a computational efficient and theoretically-founded cross-correlation analysis. Under the proposed semi-parametric model, we show that the cross-correlation estimators are asymptotically unbiased under the conditions that the sample size is large and the intrinsic dimensionality of the functional processes is much smaller than the sample size. We illustrate this correlation analysis within a demographic study, in which we analyze the association between per capita income and racial-ethnic diversity.
Data : 28 de abril de 2008 (2a feira)
Horário : 15:30 às 17:00
Título : "Three-steps data analysis pathway to study pollution bioindicators" ( ver slides )
Palestrante : Sergio Camiz (La Sapienza, Università di Roma)
Resumo : The use of bioindicators of pollution can be suitable on condition that their relation with the pollution is thoroughly modeled. A study on Pinus pinea L. needles was carried out in three sites of Italy, to ascertain which parameters of state, that can be measured on the needles, may be adopted as indicators. The followed multidimensional data analysis pathway consisted in three-steps, corresponding to exploratory, confirmatory, and modeling phases, so that in each one specific methods and tools could be used and the information obtained in each step could be used to tailor the following ones. In particular, models could be built by taking into account the results of the previous studies. It was found that the degree of pollution influences the models parameters of some indicators, rather than the indicators values, a result otherwise unpredictable. It interesting to observe that most of methods adopted are based on some optimization technique.
Data : 15 de março de 2007 (5a feira)
Horário : 13:00 às 15:00
Título : "As Vantagens do Programa Acadêmico SAS ."
Palestrantes : Polly Mitchell (diretora do programa Acadêmico das Américas) e Andrea Szyfer (gerente do Programa Acadêmico - Brasil)
Título : "Conheça as soluções estatística (Guide) e de Mineracao de Dados (Miner) do SAS."
Palestrantes : Rudger Chagas (consultor SAS) e Giovani Viglioni (pesquisador IME)
Resumo :
Enterprise Guide (EG) : orientado a aplicação em Windows, o EG foi desenvolvido para facilitar o rápido acesso a grande parte do poder analítico do SAS - para estatísticos, analistas de negócios e programadores.
Enterprise Miner : possibilita o processo de mineração de dados, criando alto nível de acerto nos modelos preditivos e descritivos - baseados na análise de grande volume de dados que estão disponíveis nas organizações
Data : 28 de setembro de 2006 (5a feira)
Título : "Introdução à modelagem dinâmica em Sistemas de Informação Geográficos (SIG) ." ( ver slides )
Palestrante : Iván Ortiz Valencia (Programa de Engenharia da Computação/UERJ)
Resumo : Fenômenos representados num SIG são inerentemente dinâmicos, porém, a sua representação computacional num SIG é essencialmente estática. A disponibilidade crescente de dados espaciais, principalmente vindos do sensoriamento remoto e redes de estações de monitoramento ambiental e o uso de modelos dinâmicos permitem analisar mudanças e obter predições de possíveis cenários negativos. O objetivo da apresentação é introduzir os conceitos básicos, limitações e aplicações da modelagem dinâmica em SIG, particularmente, as concernentes às mudanças no uso do solo.
Data :01 de junho de 2006 (5a feira)
Título : "Tratamento estatístico do conhecimento lingüístico ." ( ver slides )
Palestrante : Christina Abreu Gomes (Departamento de Lingüística e Filologia/UFRJ)
Resumo : O uso lingüístico real é altamente variável, gradiente e rico em fenômenos contínuos, mas, para os modelos teóricos da Lingüística vigentes na maior parte do século XX, o conhecimento lingüístico subjacente ao contínuo consiste em categorias discretas e critérios de gramaticalidade categórica. Há um conjunto de experimentos que demonstraram que os julgamentos dos falantes apresentam propriedades de contínuo e comportamento gradiente, e que a cognição humana é baseada em processamento probabilístico. A faculdade da linguagem apresenta propriedades probabilísticas presentes na representação, no processamento, na mudança, na aquisição e na produção. Nesta palestra serão discutidas as premissas do Usage-based Model e da Lingüística Probabilística e apresentação de aplicação de método estatístico para capturar a gradualidade da aquisição tendo como base dados de produção natural.
Data :06 de abril de 2006 (5a feira)
Título : "A teoria da medição de variáveis latentes: história e uso atual." ( ver slides )
Palestrante : Carlos A.Q. Coimbra (MAST/MCT)
Resumo : As medições realizada pela educação, psicologia, sociologia e marketing são vistas dentro de uma formulação unificada da modelagem estatística. Aplicações e limitações dos atuais programas de computador usados para estimar os modelos serão discutidas.
Data : 01 de dezembro de 2005 (5a feira)
Título : "Web 2.0: os novos caminhos da Internet."( ver slides )
Palestrante : André Bittencourt do Valle (FGV-RJ)
Resumo : A palestra versará sobre os novos padrões Web 2.0, e suas implicações no mercado das empresas de tecnologia nos próximos anos.
Data : 13 de outubro de 2005(5a feira)
Título : "O novo ambiente do sistema STATISTICA de análise de dados em suas configurações mais avançadas e algumas aplicações voltadas ao ambiente acadêmico em plataforma WEB"
Palestrante : Henrique Souza (StatSoft South America)
Resumo : Demostrações do ambiente de Data Mining e seus derivados para aplicações em bases de dados não estruturadas (textuais) e controle preditivo de processos industriais..
Data : 01 de setembro de 2005 (5a feira)
Título : "Análise de Incerteza em Modelos Estáticos de Reservatórios Petrolíferos." ( ver slides )
Palestrantes : Marcelo Costa Monteiro (Petrobras), Cláudio Bettini(UFRJ), Ricardo da Cunha Mattos Portella(Petrobras)
Resumo : Os projetos de desenvolvimento de campos de petróleo envolvem a alocação de grandes cifras, mas estão carregados de grande incerteza, resultando em alto risco. A simulação de fluxo permite avaliar a produção do reservatório ao longo do tempo. Porém exige um modelo tridimensional do reservatório, que pode ser construído via simulação estocástica condicionada aos dados disponíveis. Mas a amostragem é geralmente restrita e tendenciosa, concentrada nas melhores regiões do reservatório, resultando uma grande incerteza. Para a tomada de decisão quanto aos investimentos nos projetos de desenvolvimento é realizada uma análise de risco ou incerteza deste projeto. A análise desta incerteza pode ser resumida em: (a) identificação e construção das curvas de freqüência relativa acumulada para cada um dos parâmetros de entrada para a construção do modelo; (b) reamostragem destas curvas, gerando conjuntos de valores para a simulação estocástica; (c) construção do modelo do reservatório; (d) medida de uma função de transferência, relacionada a uma variável econômica, tal como o volume de óleo in place ou o volume total de óleo que pode ser produzido. A repetição deste procedimento para diversos conjuntos diferentes de parâmetros gera uma distribuição de resultados desta função de transferência. Esta distribuição de resultados pode auxiliar a gerência na escolha de projetos, balanceando a esperança de lucro e o risco envolvido, otimizando a carteira de projetos.
Data : 30 de junho de 2005 (5a feira)
Título : "Aplicações da Léxico-estatística em Línguas Indígenas. " ( ver slides )
Palestrante : Elder José Lanes (Faculdade de Letras - UFRJ)
Resumo :A léxico-estatística se constitui numa metodologia bastante difundida relacionada à comparação de línguas naturais. A pressuposição básica é de que as línguas humanas podem ser classificadas, em termos de seu parentesco, se tomarmos como base a contagem e o estabelecimento dos percentuais de cognatos existentes entre elas. No presente trabalho, estaremos expondo a aplicação da léxico-estatística para a classificação de um conjunto de línguas amazônicas até então não classificadas, as línguas Pano.
Data : 19 de maio de 2005 (5a feira)
Título : "Técnicas estatísticas aplicadas ao marketing de relacionamento - o caso da Reader´s Digest " ( ver slides )
Palestrante : Felipe Pinho e Rogério Vaz (Seleções do Reader´s Digest Brasil)
Resumo :Na palestra serão apresentadas as operações da Reader´s Digest e o porque da necessidade de utilização de técnicas estatísticas. Serão apresentados exemplos práticos e resultados, dando uma idéia de como é a carreira de um estatístico que trabalha com CRM (Client Relationship Management), marketing direto e marketing de relacionamento.
Data : 28 de abril de 2005 (5a feira)
Título : "Aplicações da Estatística em Lingüística: Processamento da Linguagem "
Palestrante : Marcus Maia (Faculdade de Letras - UFRJ)
Resumo :Esta apresentação enfocará a relevância da análise estatística em uma subárea dos estudos lingüísticos atualmente praticada na Faculdade de Letras da UFRJ: o processamento da linguagem. Apresentaremos dois estudos psicolingüísticos, utilizando as técnicas de questionário off-line, leitura auto-monitorada e decisão lexical. No primeiro estudo, apresentaremos dados percentuais e tempos de leitura em milésimos de segundos que permitiram estabelecer efeitos garden-path no parsing de frases estruturalmente ambíguas em português, contribuindo para o avanço do conhecimento sobre os processos de compreensão da leitura e das teorias propostas para explicá-los. Apresentaremos também a técnica de rastreamento ocular (eye-tracking), recentemente instalada em nosso laboratório (Laboratório de Psicolingüística Experimental - LAPEX), que permite o monitoramento dos tempos de fixação do olhar, tanto na leitura de texto, quanto na visualização de imagens. No segundo estudo, apresentaremos dados obtidos em uma tarefa de decisão lexical, aplicada por Guiomar Albuquerque, aluna do doutorado em Lingüística, que vem permitindo compreender melhor o processamento da leitura por crianças diagnosticadas com o transtorno do deficit da atenção ou hiperatividade.
Data : 31 de março de 2005 (5a feira)
Título : "Dos Dados ao Conhecimento: O Papel da Estatística no Marketing de Resultados." ( ver slides )
Palestrante : Eleusina Carvalho (Gerente de Database Marketing da SHOPTIME)