Eventos

Eventos

Defesa de Dissertação de Mestrado - Nº 1.880: Algoritmo de Clusterização Difusa Multi-medoides para Dados Relacionais com Múltiplas Visões

13 de Dezembro de 2019 às 16:47:28

Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado  Nº. 1.880

Aluno: Eduardo Cinta Simões
Orientador: Prof. Francisco de Assis Tenorio de Carvalho
Título: Algoritmo de Clusterização Difusa Multi-medoides para Dados 
Relacionais com Múltiplas Visões
Data: 17/12/2019
Hora/Local: 8h – Centro de Informática – Sala B020
Banca Examinadora:
Prof. Cleber Zanchettin  (UFPE / Centro de Informática)
Prof. Byron Leite Dantas Bezerra (UPE / Escola Politécnica de PE)
Prof. Francisco de Assis Tenório de Carvalho  (UFPE / Centro de Informática)


RESUMO:

Quando se deseja separar um conjunto de elementos sem um conhecimento 
prévio das suas classes, é necessário utilizar métodos de classificação 
não-supervisionada, que separam os elementos pelas suas similaridades, 
mantendo elementos muito distintos em grupos (clusters) diferentes. Em 
muitas situações, obter um conjunto de características para esses elementos 
é muito custoso, sendo mais barato obter dados relacionais, como as 
distâncias entre os elementos. Muitas vezes é possível comparar os 
elementos com diferentes critérios (visões), o que oferece mais informações 
para distinguir os elementos, permitindo a geração de matrizes de 
dissimilaridade distintas. Contudo, nem sempre as visões são relevantes 
para a solução, por causa disso, vários modelos propostos ponderam as 
diferentes visões, reduzindo a influência daquelas irrelevantes. Em muitas 
situações, existem elementos com características de várias classes, de 
forma que classificar um elemento numa única classe não o representa bem. 
Considerando isso, surgiu um conjunto de métodos de classificação difusa, 
que definem graus de pertinência dos elementos para cada classe (em 
oposição a classificação crisp, que mapeia cada elemento para apenas 1 
classe).
     Os métodos de classificação, assim como vários outros métodos de 
inteligência artificial, precisam ser configurados para obter resultados 
melhores, utilizando um conjunto de parâmetros para isso. Contudo, quanto 
mais parâmetros um método possui, mais custoso se torna a busca por bons 
parâmetros. Dessa forma, reduzir o número de parâmetros sem afetar os 
resultados é uma excelente melhoria para um método. Esta dissertação tem 
como objetivo apresentar um modelo de classificação difusa 
não-supervisionada para dados relacionais com múltiplas visões, sendo uma 
variação do modelo FW4M com um parâmetro a menos, mas com resultados 
similares ou melhores. O método proposto será comparado com o modelo FW4M e 
outros dois modelos com propósitos similares (CARD_R e MFCMdd-RWG-P) sobre 
um conjunto de bases de dados, utilizando métricas relevantes para comparar 
as classificações considerando tanto a partição difusa quanto a crisp.

Palavras-chave: Clusterização. Difusa. Multi-Medoides. Dados Relacionais. 
Multi-Visões. Restrição de Produto.