Filtration methods for rental advertisements
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
В данной работе ставится задача определения по описанию объекта недвижимости кем было написано такое объявление, риэлторами или собственниками. Делается предположение что риэлторы и агенты при написании описаний для объектов пользуются особым профессиональным языком, который сложно заметить невооружённым взглядом. Проводится анализ уже существующих решений и способы их улучшения. Для решения такой задачи строятся тематические модели при помощи LDA(Latent Dirichlet Aloocation) и проверяется насколько схожи или различны распределениям слов и тематик могут быть объявления из этих 2-х категорий.
In this work we set the goal of trying to guess whether the rental advert was writen by realtor or by the owner, using only desciption of said property. We make an assumption that while writing their desriptions of properties realtors and agents use special proffesional language, which can be hard to spot by the naked eye. We make an analysis of exististing solutions to this problem and methods of their improvement. To solve this problem we build topic models using LDA(Latent Dirichlet Aloocation) method and check how similar distributions of words and topics in those two categories can be.
In this work we set the goal of trying to guess whether the rental advert was writen by realtor or by the owner, using only desciption of said property. We make an assumption that while writing their desriptions of properties realtors and agents use special proffesional language, which can be hard to spot by the naked eye. We make an analysis of exististing solutions to this problem and methods of their improvement. To solve this problem we build topic models using LDA(Latent Dirichlet Aloocation) method and check how similar distributions of words and topics in those two categories can be.