The 21 references with contexts in paper Anna Glazkova V., А. Глазкова В. (2017) “ОЦЕНКА РЕЗУЛЬТАТИВНОСТИ ПРИМЕНЕНИЯ РАССТОЯНИЙ ЕВКЛИДА И МАХАЛАНОБИСА ДЛЯ РЕШЕНИЯ ОДНОЙ ИЗ ЗАДАЧ КЛАССИФИКАЦИИ ТЕКСТОВ // EFFICIENCY ASSESSMENT OF EUCLIDEAN AND MAKHALANOBIS DISTANCES FOR SOLVING A MAJOR TEXT CLASSIFICATION PROBLEM” / spz:neicon:vestnik:y:2017:i:1:p:86-93

1
Кадиев, П.А. Пакет программ для скремблирования информационного потока / П.А. Кадиев, И.П. Кадиев, Т.М. Мирзабеков // Вестник Дагестанского государственного технического университета. Технические науки. – 2016. – No 2. – С. 83-92.
Total in-text references: 1
  1. In-text reference with the coordinate start=5737
    Prefix
    Keywords: Euclidean distance, Mahalanobis distance, document classification, natural language processing, text characteristics, text, classification feature Введение. Решение вопросов обработки текстов на естественном языке является важным направлением развития информационного поиска
    Exact
    [1-2]
    Suffix
    . Актуальными проблемами классификации естественно-языковых текстов являются идентификация автора и адресата текста. Механизмы решения данных задач применяются при создании диалоговых и поисковых систем, систем электронного обучения и фильтрации спама.

2
Шихиев, Ф.Ш. Графовая модель синтаксиса / Ф.Ш. Шихиев // Вестник Дагестанского государственного технического университета. Техническиенауки. – 2012. – No 25. – С.
Total in-text references: 1
  1. In-text reference with the coordinate start=5737
    Prefix
    Keywords: Euclidean distance, Mahalanobis distance, document classification, natural language processing, text characteristics, text, classification feature Введение. Решение вопросов обработки текстов на естественном языке является важным направлением развития информационного поиска
    Exact
    [1-2]
    Suffix
    . Актуальными проблемами классификации естественно-языковых текстов являются идентификация автора и адресата текста. Механизмы решения данных задач применяются при создании диалоговых и поисковых систем, систем электронного обучения и фильтрации спама.

3
37. 3. Nguyen, D. Author Age Prediction from Text using Linear Regression / D. Nguyen, N. Smith, C. Rose // Proc. of ICASSP. – New-York, 2011. – P. 267-276.
Total in-text references: 2
  1. In-text reference with the coordinate start=6137
    Prefix
    Механизмы решения данных задач применяются при создании диалоговых и поисковых систем, систем электронного обучения и фильтрации спама. Проблемам атрибуции (установлению авторства) текста посвящены работы многих российских и зарубежных учѐных (в частности,
    Exact
    [3-5]
    Suffix
    ). Вопрос определения характеристик адресата текста в настоящее время является менее освещенным и затрагивается преимущественно зарубежными исследователями (работы [6-7]). В то же время задача идентификации адресата текста приобретает высокую актуальность в связи с введением возрастных ограничений на контент интернет-страниц и содержимое текстовых ресурсов.

  2. In-text reference with the coordinate start=6791
    Prefix
    Важным этапом построения классификатора является создание набора информативных признаков [8-9]. На основании полученного набора признаков проводится разбиение объектов обучающей выборки и обучение классификатора, использующее детерминированные линейные методы
    Exact
    [3; 10]
    Suffix
    или нелинейные методы, построенные на использовании деревьев решений и нейронных сетей [11-12]. Преимущество детерминированных методов состоит в большей прозрачности процесса классификации, что создает возможность пользователю системы классификации проанализировать степень зависимости результатов от значений различных классификационных признаков.

4
Кубарев, А.И. Сравнительный анализ эффективности распознавания авторского стиля текстов различными классификаторами / А.И. Кубарев, К.А. Михалева, В.В. Поддубный // Известия высших учебных заведений. Физика. – 2015. – Т. 58. No 11-2. – С. 252-258.
Total in-text references: 1
  1. In-text reference with the coordinate start=6137
    Prefix
    Механизмы решения данных задач применяются при создании диалоговых и поисковых систем, систем электронного обучения и фильтрации спама. Проблемам атрибуции (установлению авторства) текста посвящены работы многих российских и зарубежных учѐных (в частности,
    Exact
    [3-5]
    Suffix
    ). Вопрос определения характеристик адресата текста в настоящее время является менее освещенным и затрагивается преимущественно зарубежными исследователями (работы [6-7]). В то же время задача идентификации адресата текста приобретает высокую актуальность в связи с введением возрастных ограничений на контент интернет-страниц и содержимое текстовых ресурсов.

5
Муха, А.В. Автоматизированный подход к определению авторства текста / А.В. Муха, В.Л. Розалиев, Ю.А. Орлова, А.В. Заболеева-Зотова // Известия Волгоградского государственного технического университета. – 2013. – Т. 17. No 14 (117). – С. 51-54.
Total in-text references: 1
  1. In-text reference with the coordinate start=6137
    Prefix
    Механизмы решения данных задач применяются при создании диалоговых и поисковых систем, систем электронного обучения и фильтрации спама. Проблемам атрибуции (установлению авторства) текста посвящены работы многих российских и зарубежных учѐных (в частности,
    Exact
    [3-5]
    Suffix
    ). Вопрос определения характеристик адресата текста в настоящее время является менее освещенным и затрагивается преимущественно зарубежными исследователями (работы [6-7]). В то же время задача идентификации адресата текста приобретает высокую актуальность в связи с введением возрастных ограничений на контент интернет-страниц и содержимое текстовых ресурсов.

6
Akker, R. A comparison of addressee detection methods for multiparty conversations / R. Akker, D. Traum // Proc. of methods for multiparty conversations. – Amsterdam, 2009. – P. 99-106.
Total in-text references: 1
  1. In-text reference with the coordinate start=6322
    Prefix
    Проблемам атрибуции (установлению авторства) текста посвящены работы многих российских и зарубежных учѐных (в частности, [3-5]). Вопрос определения характеристик адресата текста в настоящее время является менее освещенным и затрагивается преимущественно зарубежными исследователями (работы
    Exact
    [6-7]
    Suffix
    ). В то же время задача идентификации адресата текста приобретает высокую актуальность в связи с введением возрастных ограничений на контент интернет-страниц и содержимое текстовых ресурсов.

7
Choi, D. Text Analysis for Detecting Terrorism-Related Articles on the Web / D. Choi, B. Ko, H. Kim, P. Kim // Journal of Network and Computer Applications. – 2013. – Vol. 8, No5. – P. 37-46.
Total in-text references: 1
  1. In-text reference with the coordinate start=6322
    Prefix
    Проблемам атрибуции (установлению авторства) текста посвящены работы многих российских и зарубежных учѐных (в частности, [3-5]). Вопрос определения характеристик адресата текста в настоящее время является менее освещенным и затрагивается преимущественно зарубежными исследователями (работы
    Exact
    [6-7]
    Suffix
    ). В то же время задача идентификации адресата текста приобретает высокую актуальность в связи с введением возрастных ограничений на контент интернет-страниц и содержимое текстовых ресурсов.

8
Колесникова, С.И. Методы анализа информативности разнотипных признаков / С.И. Колесникова // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. – 2009. – No1(6). – С. 69-80.
Total in-text references: 1
  1. In-text reference with the coordinate start=6620
    Prefix
    В то же время задача идентификации адресата текста приобретает высокую актуальность в связи с введением возрастных ограничений на контент интернет-страниц и содержимое текстовых ресурсов. Важным этапом построения классификатора является создание набора информативных признаков
    Exact
    [8-9]
    Suffix
    . На основании полученного набора признаков проводится разбиение объектов обучающей выборки и обучение классификатора, использующее детерминированные линейные методы [3; 10] или нелинейные методы, построенные на использовании деревьев решений и нейронных сетей [11-12].

9
Поляков, И.В. Проблема классификации текстов и дифференцирующие признаки/ И.В. Поляков, Т.В. Соколова, А.А. Чеповский, А.М. Чеповский // Вестник Новосибирского государственного университета. Серия: Информационные технологии. – 2015. – Т. 13. No 2. – С. 55-63.
Total in-text references: 1
  1. In-text reference with the coordinate start=6620
    Prefix
    В то же время задача идентификации адресата текста приобретает высокую актуальность в связи с введением возрастных ограничений на контент интернет-страниц и содержимое текстовых ресурсов. Важным этапом построения классификатора является создание набора информативных признаков
    Exact
    [8-9]
    Suffix
    . На основании полученного набора признаков проводится разбиение объектов обучающей выборки и обучение классификатора, использующее детерминированные линейные методы [3; 10] или нелинейные методы, построенные на использовании деревьев решений и нейронных сетей [11-12].

10
Толчеев, В.О. Модифицированный и обобщенный метод ближайшего соседа для классификации библиографических текстовых документов / В.О. Толчеев // Заводская лаборатория. Диагностика материалов. – 2009. – No7. – С. 63-70.
Total in-text references: 1
  1. In-text reference with the coordinate start=6791
    Prefix
    Важным этапом построения классификатора является создание набора информативных признаков [8-9]. На основании полученного набора признаков проводится разбиение объектов обучающей выборки и обучение классификатора, использующее детерминированные линейные методы
    Exact
    [3; 10]
    Suffix
    или нелинейные методы, построенные на использовании деревьев решений и нейронных сетей [11-12]. Преимущество детерминированных методов состоит в большей прозрачности процесса классификации, что создает возможность пользователю системы классификации проанализировать степень зависимости результатов от значений различных классификационных признаков.

11
Мешкова, Е.В. Методика построения классификатора текста на основе гибридной нейросетевой модели / Е.В. Мешкова // Известия ЮФУ. Технические науки. – 2008. – No 4 (81). – С. 212-215.
Total in-text references: 1
  1. In-text reference with the coordinate start=6888
    Prefix
    На основании полученного набора признаков проводится разбиение объектов обучающей выборки и обучение классификатора, использующее детерминированные линейные методы [3; 10] или нелинейные методы, построенные на использовании деревьев решений и нейронных сетей
    Exact
    [11-12]
    Suffix
    . Преимущество детерминированных методов состоит в большей прозрачности процесса классификации, что создает возможность пользователю системы классификации проанализировать степень зависимости результатов от значений различных классификационных признаков.

12
Козоброд, А.В. Анализ архитектур гибридных нейросетевых моделей в задачах автоматической классификации текстовой информации / А.В. Козоброд, В.Е. Мешков, Е.В. Мешкова // Известия ЮФУ. Технические науки. – 2010. – No 12 (113). – С. 185-190.
Total in-text references: 1
  1. In-text reference with the coordinate start=6888
    Prefix
    На основании полученного набора признаков проводится разбиение объектов обучающей выборки и обучение классификатора, использующее детерминированные линейные методы [3; 10] или нелинейные методы, построенные на использовании деревьев решений и нейронных сетей
    Exact
    [11-12]
    Suffix
    . Преимущество детерминированных методов состоит в большей прозрачности процесса классификации, что создает возможность пользователю системы классификации проанализировать степень зависимости результатов от значений различных классификационных признаков.

13
Ким, Дж.-О. Факторный, дискриминантный и кластерный анализ: Пер. с англ. / Дж.-О. Ким, Ч.У. Мьюллер, У.Р. Клекка, М.С. Олдендерфер, Р.К. Блэшфилд. – М.: Финансы и статистика, 1989. – 215 с.
Total in-text references: 2
  1. In-text reference with the coordinate start=8761
    Prefix
    В табл. 1 в обобщенном виде приводится перечень наиболее часто применяемых метрик и коэффициентов ассоциативности, используемых для установления меры близости объектов, описанных бинарными переменными
    Exact
    [13-14]
    Suffix
    . Таблица 1. Методы установления меры близости объектов Table 1. Methods for establishing the proximity of objects Мера близости Шкала измерения признаков Примечание Евклидово расстояние Количественные шкалы Представляет собой геометрическое расстояние в многомерном пространстве признаков.

  2. In-text reference with the coordinate start=15391
    Prefix
    То есть оно применимо в случае, когда необходимо определить два объекта как различные, исходя из значений одного признака [21]. Коэффициенты ассоциативности, в отличие от мер сходства, предназначены для сравнения объекта не с эталоном, а для определения некой взаимной упорядоченности объектов
    Exact
    [13]
    Suffix
    . Для проведения же классификации по известным классам необходимо вычисление именно меры близости объекта с эталоном, то есть с центроидом класса. Вывод. Описанный в работе вычислительный эксперимент призван определить наиболее эффективный метод решения задачи определения возрастной категории потенциальных адресатов текста.

14
Хачумов, М.В. Расстояния, метрики и кластерный анализ / М.В. Хачумов // Искусственный интеллект и принятие решений. – 2012. – No1. – С. 81-89.
Total in-text references: 1
  1. In-text reference with the coordinate start=8761
    Prefix
    В табл. 1 в обобщенном виде приводится перечень наиболее часто применяемых метрик и коэффициентов ассоциативности, используемых для установления меры близости объектов, описанных бинарными переменными
    Exact
    [13-14]
    Suffix
    . Таблица 1. Методы установления меры близости объектов Table 1. Methods for establishing the proximity of objects Мера близости Шкала измерения признаков Примечание Евклидово расстояние Количественные шкалы Представляет собой геометрическое расстояние в многомерном пространстве признаков.

15
Толмачев, И.Л. Бинарная классификация на основе варьирования размерности пространства признаков и выбора эффективной метрики / И.Л. Толмачев, М.В. Хачумов // Искусственный интеллект и принятие решений. – 2010. – No2. – С. 3-10.
Total in-text references: 1
  1. In-text reference with the coordinate start=10818
    Prefix
    В данной работе, исходя из особенностей поставленной задачи, а также предположений о составе набора классификационных признаков, для вычисления меры близости текстов были выбраны расстояние Евклида и расстояние Махаланобиса. Обе меры близости неоднократно применялись для решения задач классификации
    Exact
    [15-17]
    Suffix
    и в зависимости от условий постановки задачи демонстрировали ту или иную степень предпочтительности своего использования. Расчет расстояния Евклида проводился по классической формуле вычисления меры близости объектов, представленных точками в многомерном пространстве: 2 1 k Eii i ( x,y )( x y ) ,   (1) где xi, yi — значения i-го признака объектов x и y; k – общ

16
Хачумов, М.В. Применение нейрона и расстояния Евклида-Махаланобиса в задаче бинарной классификации / М.В. Хачумов // Наука и современность. – 2010. – No2-3. – С. 82-86.
Total in-text references: 1
  1. In-text reference with the coordinate start=10818
    Prefix
    В данной работе, исходя из особенностей поставленной задачи, а также предположений о составе набора классификационных признаков, для вычисления меры близости текстов были выбраны расстояние Евклида и расстояние Махаланобиса. Обе меры близости неоднократно применялись для решения задач классификации
    Exact
    [15-17]
    Suffix
    и в зависимости от условий постановки задачи демонстрировали ту или иную степень предпочтительности своего использования. Расчет расстояния Евклида проводился по классической формуле вычисления меры близости объектов, представленных точками в многомерном пространстве: 2 1 k Eii i ( x,y )( x y ) ,   (1) где xi, yi — значения i-го признака объектов x и y; k – общ

17
Шумская, А.О. Оценка эффективности метрик расстояния Евклида и расстояния Махаланобиса в задачах идентификации происхождения текста / А.О. Шумская // Доклады Томского государственного университета систем управления и радиоэлектроники. – 2013. – No3 (29). – С. 141-145.
Total in-text references: 1
  1. In-text reference with the coordinate start=10818
    Prefix
    В данной работе, исходя из особенностей поставленной задачи, а также предположений о составе набора классификационных признаков, для вычисления меры близости текстов были выбраны расстояние Евклида и расстояние Махаланобиса. Обе меры близости неоднократно применялись для решения задач классификации
    Exact
    [15-17]
    Suffix
    и в зависимости от условий постановки задачи демонстрировали ту или иную степень предпочтительности своего использования. Расчет расстояния Евклида проводился по классической формуле вычисления меры близости объектов, представленных точками в многомерном пространстве: 2 1 k Eii i ( x,y )( x y ) ,   (1) где xi, yi — значения i-го признака объектов x и y; k – общ

18
База данных метатекстовой разметки Национального корпуса русского языка» (коллекция детской литературы)». 2014.
Total in-text references: 1
  1. In-text reference with the coordinate start=11671
    Prefix
    В ходе вычислительного эксперимента использовались база данных «Морфологический стандарт Национального корпуса русского языка» и «База данных метатекстовой разметки Национального корпуса русского языка» (коллекция детской литературы)»
    Exact
    [18]
    Suffix
    . Тексты, составляющие Национальный корпус русского языка [19], размечены по различным лингвистическим параметрам. Базы содержат заведомо качественные и максимально разнообразные тексты на русском языке, возрастная категория потенциальных читателей которых – взрослая или детская – определена на основании мнений экспертов.

19
Национальный корпус русского языка [Электронный ресурс]. 2015. URL: http:// ruscorpora.ru/ (дата обращения: 26.07.2016).
Total in-text references: 1
  1. In-text reference with the coordinate start=11738
    Prefix
    В ходе вычислительного эксперимента использовались база данных «Морфологический стандарт Национального корпуса русского языка» и «База данных метатекстовой разметки Национального корпуса русского языка» (коллекция детской литературы)» [18]. Тексты, составляющие Национальный корпус русского языка
    Exact
    [19]
    Suffix
    , размечены по различным лингвистическим параметрам. Базы содержат заведомо качественные и максимально разнообразные тексты на русском языке, возрастная категория потенциальных читателей которых – взрослая или детская – определена на основании мнений экспертов.

20
Глазкова, А.В. Проверка информативности классификационных признаков в задаче автоматической классификации текстов на естественном языке / А.В. Глазкова // Открытые семантические технологии проектирования интеллектуальных систем (OSTIS-2015): материалы конференции. – 2015. – С. 541-544.
Total in-text references: 1
  1. In-text reference with the coordinate start=12475
    Prefix
    В исследовании, в соответствии с выборкой, предоставленной для эксперимента, используется деление текстов на детские и взрослые. Набор классификационных признаков. Анализ данных показал возможность использования следующего набора классификационных признаков
    Exact
    [20]
    Suffix
    : – средняя длина слов текста (кроме стоп-слов); – среднее количество слов в предложении; – количество многосложных слов в тексте (более трех слогов, %); – количество особых глагольных форм в тексте (%); – среднее количество грамматических основ в предложении; – количество числительных в тексте (%); – доля простых предложений с двумя главными членами (относительно простых предложен

21
Буреева, Н.Н. Многомерный статистический анализ с использованием ППП ―STATISTICA‖ / Н.Н. Буреева. – Нижний Новгород: Нижегородский государственный университет им. Н.И. Лобачевского, 2007. – 112 с.
Total in-text references: 1
  1. In-text reference with the coordinate start=15201
    Prefix
    Это обусловлено тем, что расстояние Чебышева высчитывается как абсолютное значение максимальной разности последовательных пар значений признаков, характеризующих тексты. То есть оно применимо в случае, когда необходимо определить два объекта как различные, исходя из значений одного признака
    Exact
    [21]
    Suffix
    . Коэффициенты ассоциативности, в отличие от мер сходства, предназначены для сравнения объекта не с эталоном, а для определения некой взаимной упорядоченности объектов [13]. Для проведения же классификации по известным классам необходимо вычисление именно меры близости объекта с эталоном, то есть с центроидом класса.