Please use this identifier to cite or link to this item:
http://hdl.handle.net/11701/13621
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Кац Владимир Наумович | ru_RU |
dc.contributor.author | Ашихмина Алена Сергеевна | ru_RU |
dc.contributor.author | Ashikhmina Alena | en_GB |
dc.contributor.editor | Мишенин Алексей Николаевич | ru_RU |
dc.contributor.editor | Mishenin Aleksei Nikolаevich | en_GB |
dc.date.accessioned | 2018-07-26T15:26:28Z | - |
dc.date.available | 2018-07-26T15:26:28Z | - |
dc.date.issued | 2018 | - |
dc.identifier.other | 040181 | en_GB |
dc.identifier.uri | http://hdl.handle.net/11701/13621 | - |
dc.description.abstract | В этой работе решается задача понимания и обобщения семантической связности внутри текста деловых документов, с целью решения задачи выявления "аномалий" - то есть намеренных или случайных искажений содержания таких документов. Задача актуальна на практике, так как может использоваться для поиска опечаток и мошеннических действий. В работе предложено несколько подходов, которые базируют на векторном представлении слов и тематическом моделировании. Каждый из предложенных подходов был реализован и оценен. Результаты показали, что построенные алгоритмы имеют неплохое качество. | ru_RU |
dc.description.abstract | In this paper, we solve the problem of understanding and generalization of semantic coherence within the text of business documents, with a view to solving the problem of detecting "anomalies" - that is, intentional or accidental distortion content of such documents. The task is actual in practice, as it can be used to search for typos and fraudulent activities. The paper suggests several approaches that are based on the vector representation of words and thematic modeling. Each of the proposed approaches was implemented and evaluated. The results showed that the constructed algorithms have a good quality. | en_GB |
dc.language.iso | ru | - |
dc.subject | Тематическое моделирование | ru_RU |
dc.subject | машинное обучение | ru_RU |
dc.subject | обработка естественного языка | ru_RU |
dc.subject | LDA | en_GB |
dc.subject | texttiling | en_GB |
dc.subject | machine learning | en_GB |
dc.subject | nlp | en_GB |
dc.subject | thematic modeling | en_GB |
dc.title | Semantic coherence validation in business documents on the example of contracts | en_GB |
dc.title.alternative | Определение семантической связности юридических документов на примере договоров | ru_RU |
Appears in Collections: | BACHELOR STUDIES |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
main.pdf | Article | 2,16 MB | Adobe PDF | View/Open |
reviewSV_Ashikhmina_Review.pdf | ReviewSV | 71,67 kB | Adobe PDF | View/Open |
reviewSV_otzyv_recenzenta_Ashixmina.pdf | ReviewRev | 553,87 kB | Adobe PDF | View/Open |
reviewSV_stt07172_Kac_Vladimir_Naumovich_(reviewer)(Ru).txt | ReviewRev | 3,4 kB | Text | View/Open |
reviewSV_st008168_Mishenin_Aleksej_Nikolaevich_(supervisor)(Ru).txt | ReviewSV | 2,88 kB | Text | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.