مرکز منطقه ای اطلاع رساني علوم و فناوري - Discriminatively trained spoken document similarity models and their application to probabilistic latent semantic analysis

DocumentCode :

1857670

Title :

Discriminatively trained spoken document similarity models and their application to probabilistic latent semantic analysis

Author :

Thambiratnam, K. ; Seide, F. ; Yu, P.

Author_Institution :

Beijing Sigma Center, Microsoft Res. Asia, Beijing

fYear :

2006

fDate :

10-13 Dec. 2006

Firstpage :

Lastpage :

Abstract :

This paper presents a novel framework for discriminatively training spoken document similarity models. Traditional similarity methods such as Vector Space Modeling and Probabilistic Latent Semantic Analysis suffer from a mismatch in modeling and evaluation objective functions. This work proposes reconciling this mismatch by using a discriminative training process in conjunction with prior knowledge of known document relationships to train an ensemble of spoken document similarity models. The reported experiments demonstrate dramatic improvements in mAP performance for the tasks of related document search and query-by-document retrieval, and highlight the ability of the resulting models to better generalize to unseen topics and unseen documents.

Keywords :

document handling; natural language processing; query processing; discriminatively trained spoken document similarity models; document search; mAP performance; probabilistic latent semantic analysis; query-by-document retrieval; vector space modeling; Advertising; Frequency; Functional analysis; Information retrieval; Multimedia databases; Neodymium; Robustness; Space technology; Speech analysis; Speech recognition;

fLanguage :

English

Publisher :

ieee

Conference_Titel :

Spoken Language Technology Workshop, 2006. IEEE

Conference_Location :

Palm Beach

Print_ISBN :

1-4244-0872-5

Type :

conf

DOI :

10.1109/SLT.2006.326812

Filename :

4123357

Link To Document :

https://search.ricest.ac.ir/dl/search/defaultta.aspx?DTC=49&DC=1857670