Entrar | Contactos | Dicionário | FLiP.pt | LegiX.pt | Blogue | Loja

Seminários

Priberam Machine Learning Lunch Seminars

Série de seminários sobre aprendizagem automática (machine learning) patrocinados pela Priberam que têm lugar quinzenalmente no Instituto Superior Técnico. O objectivo destes seminários é criar uma nova plataforma de discussão envolvendo diferentes grupos de investigação (dentro e fora do IST) com um interesse comum neste campo. Os seminários têm como destinatários uma lista de participantes interessados em áreas como (mas não limitadas a): teoria da aprendizagem estatística, processamento de sinal, reconhecimento de padrões, visão por computador, processamento de língua natural, biologia computacional, redes neuronais, sistemas de controlo, aprendizagem por reforço ou qualquer coisa relacionada (mesmo que vagamente) com aprendizagem automática.

Cada sessão é bastante informal e tem a duração de uma hora com uma parte para perguntas e discussão. Há um orador voluntário que escolhe livremente o tópico da sua apresentação. Poderá, por exemplo, falar da sua investigação, descrever um problema desafiante, explorar uma linha de investigação particular, ensaiar uma apresentação numa conferência, etc. Por vezes (mas não como regra) há oradores convidados. A lista de todas as sessões, com o respectivo orador, título e resumo encontra-se do lado direito desta página.

Os seminários são gratuitos e abertos a todos os que queiram participar (não é necessária inscrição). Para encorajar ainda mais a participação, os encontros são à hora do almoço e comida deliciosa (e gratuita!) é fornecida aos participantes.

Foi criada uma mailing list específica para discutir os assuntos relacionados com os seminários. Os interessados podem subscrever a lista enviando um email para seminarios-mlpb-request@freelists.org com 'subscribe' no campo Assunto ou visitando a página da lista em http://www.freelists.org/list/seminarios-mlpb. A discussão relativa à organização dos seminários e calendário das apresentações tem lugar nesta lista. Todas as sugestões são bem-vindas!

Nota: estes seminários são patrocinados pela Priberam, uma IST spin-off que aplica técnicas de aprendizagem automática no processamento da língua natural.

 

Terça-feira, 22 de Maio 2012, 13h00 - 14h00

José Costa Pereira (University of California, San Diego, USA)

A New Approach to Cross-Modal Multimedia Retrieval

Sala PA2 (Pavilhão de Pós-Graduação)

Instituto Superior Técnico - Alameda

Abstract:

The problem of cross-modal retrieval from multimedia repositories is considered. This problem addresses the design of retrieval systems that support queries across content modalities, e.g. using text to search for images. A mathematical formulation is proposed, equating the design of cross-modal retrieval systems to that of isomorphic feature spaces for different content modalities. Two hypotheses are investigated, regarding the fundamental attributes of these spaces. The first is that low-level cross-modal correlations should be accounted for. The second is that the space should enable semantic abstraction. Three new solutions to the cross-modal retrieval problem are then derived from these hypotheses: correlation matching (CM), which models cross-modal correlations, semantic matching (SM), which relies on semantic representation, and semantic correlation matching (SCM), which combines both.

On a second part of this talk, the problem of image retrieval using the query-by-example paradigm is considered. Recent research efforts in semantic representations and context modeling are based on the principle of task expansion: that vision problems such as object recognition, scene classification, or retrieval (RCR) cannot be solved in isolation. The extended principle of modality expansion (that RCR problems cannot be solved from visual information alone) is investigated. A semantic image labeling system is augmented with text. Pairs of images and text are mapped to a semantic space, and the text features used to regularize their image counterparts. This is done with a new cross-modal regularizer, which learns the mapping of the image features that maximizes their average similarity to those derived from text. The proposed regularizer is class-sensitive, combining a set of class-specific denoising transformations and nearest neighbor interpolation of text-based class assignments.

--

Bio: José Costa Pereira received a Licenciatura in Computer Science and Engineering from Faculdade de Engenharia (2000), and a M.S. in Computational Methods in Science and Engineering from a joint-venture between Faculdade de Ciencias and Faculdade de Engenharia (2003), all from University of Porto, Portugal. He has worked for Vodafone Portugal in the Data Networks group, from 2000 to 2005; joining the IP Division at Alcatel-Lucent in September 2005 just before joining graduate school.
Since 2008, he works has a Ph.D. student in the Statistical and Visual Computing Lab (SVCL) in the Electrical and Computer Engineering Department, in the University of California, San Diego, USA. His current research is focused on image retrieval and classification, exploring contextual relations for image annotation. In the past, as part of his M.S. thesis, he has developed an Independent Component Analysis (ICA) based method for Blind Source Separation (BSS).

 

 
T1
T2
January 10th - José Santos
January 24th - Miguel Almeida
February 7th - André Martins
February 14th - Pedro Bizarro
March 6th - Ramon Astudillo
March 20th - Sérgio Pequito
April 3rd - Robert P.W. Duin
April 17th - Artur Ferreira



Instituto Superior Técnico

Priberam.pt