Please use this identifier to cite or link to this item:
https://hdl.handle.net/10316.2/38726
DC Field | Value | Language |
---|---|---|
dc.contributor.author | Zhekova, Desislava | - |
dc.contributor.author | Zangenfeind, Robert | - |
dc.contributor.author | Mikhaylova, Alena | - |
dc.contributor.author | Nikolaienko, Tetiana | - |
dc.date.accessioned | 2016-03-01T10:13:44Z | |
dc.date.accessioned | 2020-10-04T00:50:07Z | - |
dc.date.available | 2016-03-01T10:13:44Z | |
dc.date.available | 2020-10-04T00:50:07Z | - |
dc.date.issued | 2016 | - |
dc.identifier.issn | 2182-8830 | - |
dc.identifier.uri | https://hdl.handle.net/10316.2/38726 | - |
dc.description.abstract | Este artigo apresenta a aplicação de corpora multialvo paralelos – compostos por um único texto-fonte e múltiplas traduções-alvo desse texto – para análise linguística. Discute-se o alinhamento, busca interativa e visualização deste tipo de dados usando uma ferramenta específica chamada ALuDo (Alinhamento com Lucene para Dostoievski). Trata-se de uma aplicação Java que utiliza gramáticas locais, informação ontológica, dicionários bilingues e abordagens estatísticas para alinhamento e pesquisa. O conjunto de dados utilizado é constituído pelo romance russo Crime e Castigo de Fiodor Dostoievski e três traduções do romance em alemão. Com este corpus bilingue é possível levar a cabo investigação significativa no campo da linguística e dos estudos literários. Adicionalmente, publicamos parte do corpus paralelo resultante. | por |
dc.description.abstract | This paper presents the application of multi-target parallel corpora consisting of a single source text and multiple target translations of it for linguistic analysis. We discuss the alignment, interactive search and visualization of this type of data within a specific tool called ALuDo (Alignment with Lucene for Dostoyevsky). This is a Java implementation that uses local grammars, ontological information, bilingual dictionaries and statistical approaches for alignment and search. The data set in use is the Russian novel Crime and Punishment by Fyodor Dostoyevsky and three German translations of it. With this bilingual corpus quite a number of investigations in the field of linguistics and of literary studies are possible. Additionally, we release part of the resulting parallel corpus. | eng |
dc.language.iso | eng | - |
dc.publisher | Centro de Literatura Portuguesa | - |
dc.publisher | Imprensa da Universidade de Coimbra | - |
dc.rights | open access | - |
dc.subject | interactive alignment | eng |
dc.subject | rule-based alignment | eng |
dc.subject | statistical alignment | eng |
dc.subject | coreference resolution | eng |
dc.subject | paraphrase identification | eng |
dc.subject | alinhamento interativo | por |
dc.subject | alinhamento baseado em regras | por |
dc.subject | alinhamento estatístico | por |
dc.subject | resolução de correferência | por |
dc.subject | identificação de paráfrase | por |
dc.title | Sentence-alignment and application of russian-german multi-target parallel corpora for linguistic analysis and literary studies | por |
dc.type | article | - |
uc.publication.collection | Matlit v. 4, nº 1 | - |
uc.publication.firstPage | 45 | - |
uc.publication.issue | 1 | - |
uc.publication.lastPage | 61 | - |
uc.publication.location | Coimbra | - |
uc.publication.journalTitle | Matlit: Revista do Programa de Doutoramento em Materialidades da Literatura | - |
uc.publication.volume | 4 | por |
dc.identifier.doi | 10.14195/2182-8830_4-1_3 | - |
uc.publication.section | Secção temática = Thematic section | - |
uc.publication.orderno | 3 | - |
uc.publication.area | Artes e Humanidades | - |
uc.publication.manifest | https://dl.uc.pt/json/iiif/10316.2/38726/264008/manifest?manifest=/json/iiif/10316.2/38726/264008/manifest | - |
uc.publication.thumbnail | https://dl.uc.pt/retrieve/12078295 | - |
item.fulltext | With Fulltext | - |
item.grantfulltext | open | - |
Appears in Collections: | Matlit |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
sentence_alignment_and_application.pdf | 1.18 MB | Adobe PDF |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.