Please use this identifier to cite or link to this item: https://hdl.handle.net/10316.2/38726
DC FieldValueLanguage
dc.contributor.authorZhekova, Desislava-
dc.contributor.authorZangenfeind, Robert-
dc.contributor.authorMikhaylova, Alena-
dc.contributor.authorNikolaienko, Tetiana-
dc.date.accessioned2016-03-01T10:13:44Z
dc.date.accessioned2020-10-04T00:50:07Z-
dc.date.available2016-03-01T10:13:44Z
dc.date.available2020-10-04T00:50:07Z-
dc.date.issued2016-
dc.identifier.issn2182-8830-
dc.identifier.urihttps://hdl.handle.net/10316.2/38726-
dc.description.abstractEste artigo apresenta a aplicação de corpora multialvo paralelos – compostos por um único texto-fonte e múltiplas traduções-alvo desse texto – para análise linguística. Discute-se o alinhamento, busca interativa e visualização deste tipo de dados usando uma ferramenta específica chamada ALuDo (Alinhamento com Lucene para Dostoievski). Trata-se de uma aplicação Java que utiliza gramáticas locais, informação ontológica, dicionários bilingues e abordagens estatísticas para alinhamento e pesquisa. O conjunto de dados utilizado é constituído pelo romance russo Crime e Castigo de Fiodor Dostoievski e três traduções do romance em alemão. Com este corpus bilingue é possível levar a cabo investigação significativa no campo da linguística e dos estudos literários. Adicionalmente, publicamos parte do corpus paralelo resultante.por
dc.description.abstractThis paper presents the application of multi-target parallel corpora consisting of a single source text and multiple target translations of it for linguistic analysis. We discuss the alignment, interactive search and visualization of this type of data within a specific tool called ALuDo (Alignment with Lucene for Dostoyevsky). This is a Java implementation that uses local grammars, ontological information, bilingual dictionaries and statistical approaches for alignment and search. The data set in use is the Russian novel Crime and Punishment by Fyodor Dostoyevsky and three German translations of it. With this bilingual corpus quite a number of investigations in the field of linguistics and of literary studies are possible. Additionally, we release part of the resulting parallel corpus.eng
dc.language.isoeng-
dc.publisherCentro de Literatura Portuguesa-
dc.publisherImprensa da Universidade de Coimbra-
dc.rightsopen access-
dc.subjectinteractive alignmenteng
dc.subjectrule-based alignmenteng
dc.subjectstatistical alignmenteng
dc.subjectcoreference resolutioneng
dc.subjectparaphrase identificationeng
dc.subjectalinhamento interativopor
dc.subjectalinhamento baseado em regraspor
dc.subjectalinhamento estatísticopor
dc.subjectresolução de correferênciapor
dc.subjectidentificação de paráfrasepor
dc.titleSentence-alignment and application of russian-german multi-target parallel corpora for linguistic analysis and literary studiespor
dc.typearticle-
uc.publication.collectionMatlit v. 4, nº 1-
uc.publication.firstPage45-
uc.publication.issue1-
uc.publication.lastPage61-
uc.publication.locationCoimbra-
uc.publication.journalTitleMatlit: Revista do Programa de Doutoramento em Materialidades da Literatura-
uc.publication.volume4por
dc.identifier.doi10.14195/2182-8830_4-1_3-
uc.publication.sectionSecção temática = Thematic section-
uc.publication.orderno3-
uc.publication.areaArtes e Humanidades-
uc.publication.manifesthttps://dl.uc.pt/json/iiif/10316.2/38726/264008/manifest?manifest=/json/iiif/10316.2/38726/264008/manifest-
uc.publication.thumbnailhttps://dl.uc.pt/retrieve/12078295-
item.fulltextWith Fulltext-
item.grantfulltextopen-
Appears in Collections:Matlit
Files in This Item:
File Description SizeFormat 
sentence_alignment_and_application.pdf1.18 MBAdobe PDFThumbnail
  
See online
Show simple item record

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.