The 13 reference contexts in paper Alexey Yushin Yu., Алексей Юшин Юрьевич (2015) “ИНСТРУМЕНТЫ МОНИТОРИНГА РЫНКА НЕДВИЖИМОСТИ МОСКОВСКОГО РЕГИОНА // TOOLS FOR MONITORING THE REAL ESTATE MARKET IN THE MOSCOW REGION” / spz:neicon:statecon:y:2015:i:2:p:151-154

  1. Start
    1447
    Prefix
    Keywords: monitoring real estate market, sources of information about the real estate market, real estate valuation, tools for collecting and processing information about the real estate market. 1. Введение Известный исследователь рынка недвижимости, Стерник Г.М., выделяет мониторинг как наиболее общий элемент анализа рынка, изначально подразумевая сбор и обработку информации
    Exact
    [2]
    Suffix
    и позднее выделяя 4 этапа общего анализа рынка недвижимости (сбор и обработка данных, мониторинг, исследование и прогнозирование) [1]. Первые два этапа отмечаются как наиболее трудоемкие и необходимые.
    (check this in PDF content)

  2. Start
    1571
    Prefix
    Введение Известный исследователь рынка недвижимости, Стерник Г.М., выделяет мониторинг как наиболее общий элемент анализа рынка, изначально подразумевая сбор и обработку информации [2] и позднее выделяя 4 этапа общего анализа рынка недвижимости (сбор и обработка данных, мониторинг, исследование и прогнозирование)
    Exact
    [1]
    Suffix
    . Первые два этапа отмечаются как наиболее трудоемкие и необходимые. Здесь под мониторингом уже понимается статистическая обработка, анализ и оценка показателей. Не будем так широко трактовать это понятие и сконцентрируемся на решении задач, связанных с непрерывным сбором и обработкой информации о рынке.
    (check this in PDF content)

  3. Start
    3286
    Prefix
    Сейчас эти задачи решаются профессиональными участниками рынка самостоятельно, централизованно эта информация не собирается. С предложением ситуация обратная, исходных данных очень много. Ее источниками являются как профессиональные инструменты, например «Winner»
    Exact
    [5]
    Suffix
    и «Cian»[4], так и множество сайтов (порталов, площадок), предоставляющих сервис по размещению объявлений, например «Из Рук в Руки», «Недвижимость и Цены», «Где Этот Дом» и т.п. Часто объявления уже содержат некоторую информацию об объектах (зданиях) из базы БТИ, год постройки, количество лифтов, планировки.
    (check this in PDF content)

  4. Start
    3299
    Prefix
    Сейчас эти задачи решаются профессиональными участниками рынка самостоятельно, централизованно эта информация не собирается. С предложением ситуация обратная, исходных данных очень много. Ее источниками являются как профессиональные инструменты, например «Winner»[5] и «Cian»
    Exact
    [4]
    Suffix
    , так и множество сайтов (порталов, площадок), предоставляющих сервис по размещению объявлений, например «Из Рук в Руки», «Недвижимость и Цены», «Где Этот Дом» и т.п. Часто объявления уже содержат некоторую информацию об объектах (зданиях) из базы БТИ, год постройки, количество лифтов, планировки.
    (check this in PDF content)

  5. Start
    5241
    Prefix
    Корректное отображение такого сайта в браузере уже сложная задача, вероятно с этим связано отсутствие развития. С другой стороны «Realto» единственная база, которая официально предлагает купить архивы предложений. База Циан
    Exact
    [4]
    Suffix
    , пожалуй, второй по значимости инструмент размещения и поиска объявлений в московском регионе. Пользуется особой популярностью среди специалистов, занимающихся арендой. Отличается строгим контролем качества, благодаря «обратной связи» и ручной проверке объявлений.
    (check this in PDF content)

  6. Start
    6520
    Prefix
    «Яндекс-недвижимость» относительно молодой проект, но у него есть серьезное конкурентное преимущество – любой поиск начинается с поисковой системы. На начальном этапе «Яндекс» сотрудничал исключительно с агрегаторами, которые быстро поняли, что получается «игра в одни ворота»
    Exact
    [9]
    Suffix
    . 3. Инструменты сбора информации Как правило, типичный информационный ресурс старается с одной стороны затруднить автоматизированный сбор информации, а с другой, не брезгует копированием объявлений конкурентов [7].
    (check this in PDF content)

  7. Start
    6717
    Prefix
    Инструменты сбора информации Как правило, типичный информационный ресурс старается с одной стороны затруднить автоматизированный сбор информации, а с другой, не брезгует копированием объявлений конкурентов
    Exact
    [7]
    Suffix
    . Обозначим основные проблемы автоматизированного получения информации с онлайн ресурсов и способы их решения. • Отсутствие четкой структуры, некорректность кода разметки страниц. Если живой посетитель легко понимает содержание страницы, то для программы небольшое изменение структуры может оказаться фатальным.
    (check this in PDF content)

  8. Start
    7262
    Prefix
    • Ограничения на общее количество запросов, их скорость (количество в единицу времени). Решением является использование промежуточных (proxy) серверов, сведения о которых можно получать посредством API
    Exact
    [6]
    Suffix
    . • Наличие так называемых «капчей» (captcha), или представление контактных сведений в виде картинок. Существуют автоматизированные сервисы по распознаванию с API. • Наиболее трудоемкий способ противодействия — использование скриптов, программно отображающих информацию на экране.
    (check this in PDF content)

  9. Start
    8005
    Prefix
    Это важный источник информации о субъектах рынка – должниках, которые не смогли расплатиться за квартиру или иной объект недвижимости. «Разобрать» или «распарсить» (от англ. parse – разбор) подобные сайты традиционными методами, затруднительно. На этот случай есть решения в виде «безголовых браузеров»
    Exact
    [10]
    Suffix
    . У них отсутствует графический интерфейс и для программного взаимодействия реализован API. Можно сделать вывод: какие бы «изощренные» методы не использовались для затруднения получения информации, найдется не менее эффективное решение.
    (check this in PDF content)

  10. Start
    10143
    Prefix
    При обработке предложений рынка, надо быть готовым к тому что контактные сведения могут быть представлены в произвольном текстовом виде, не только в специальных полях, но и, например, в описании объекта. Некоторые доски объявлений показывают телефонные номера в виде картинок. Для решения задачи выявления номеров в стандартном виде из произвольного текста идеально подходит библиотека
    Exact
    [8]
    Suffix
    . 4.2. Вычисление стоимости объекта в валюте. После кризиса 2008 года, большинство сделок на рынке, особенно в эконом-классе, осуществлялись в рублях. В связи с резким падением курса рубля в конце 2014 года возникают опасения, что доллар может вновь вернуться на рынок недвижимости.
    (check this in PDF content)

  11. Start
    11181
    Prefix
    Как нормализовать адрес, составленный в свободной форме, т.е. разбить его на составляющие (город, район, улица, дом, метро)? Для этого подходят инструменты, предоставляемые поисковыми системами, например Google Geocoding Api
    Exact
    [12]
    Suffix
    . 4.4. Выявления дубликатов и недостоверных сведений Одно и тоже объявление, как правило, можно обнаружить в разных информационных базах или онлайн-ресурсах. Они могут быть с разными значениями цен, в них могут быть ошибки.
    (check this in PDF content)

  12. Start
    11539
    Prefix
    Они могут быть с разными значениями цен, в них могут быть ошибки. Иногда основной мотив – чем больше объявлений, тем больше звонков, при этом объявление может быть «уткой» или заимствовано у реального продавца. Существуют алгоритмы
    Exact
    [3]
    Suffix
    выявления дубликатов, но в автоматическом режиме эта проблема решается лишь частично, поскольку параметры недостоверного объекта могут выглядеть корректно. Профессиональные информационные базы пытаются бороться с этим явлением, в том числе обзванивая объявления и с помощью «обратной связи». 4.5.
    (check this in PDF content)

  13. Start
    12864
    Prefix
    Как реализовать эти алгоритмы на практике? Относительно недавно появились специальные графовые базы данных, которые оперируют не таблицами со строго заданными полями, а гибкой структурой в виде вершин графа и связями между ними. Neo4j
    Exact
    [11]
    Suffix
    была одной из первых созданных графовых СУБД. С тех пор это направление бурно развивается и в настоящее время таких СУБД существуют десятки. Немалую роль в этом сыграло развитие социальных сетей, где графовая постановка задачи требовала новых подходов к развитию программного обеспечения. 5.
    (check this in PDF content)