The 9 reference contexts in paper A. Sotnikov N., E. Andrianova G., I. Cherednychenko N., А. Сотников Н., Е. Андрианова Г., И. Чередниченко Н. (2016) “Аппаратно - программный комплекс обработки и создания неформатных электронных документов на основе технологии автоадаптивных шрифтов // Apparatus-Program Complexes Processing and Creation of Essentially non-Format Documents on the Basis of Technology Auto-Adaptive Fonts” / spz:neicon:technomag:y:2014:i:1:p:623-634

  1. Start
    4514
    Prefix
    Специальные подходы, методы обработки и принципы хранения и представления данных в неформатных электронных документов разработаны недостаточно, а проблемы их разработки остаются крайне актуальны. История вопроса Начало работ по созданию электронных версий бумажных документов было положено проектом Gutenberg в 1971 году
    Exact
    [1]
    Suffix
    . Перевод в электронный вид первой тысячи книг в электронный вид занял 10 лет, но сейчас темпы стремительно выросли. Современные проекты электронных библиотек уже насчитывают миллионы единиц в коллекции и еще больше необработанных неформатных документов, требующих перевода в электронный вид [2].
    (check this in PDF content)

  2. Start
    4807
    Prefix
    Перевод в электронный вид первой тысячи книг в электронный вид занял 10 лет, но сейчас темпы стремительно выросли. Современные проекты электронных библиотек уже насчитывают миллионы единиц в коллекции и еще больше необработанных неформатных документов, требующих перевода в электронный вид
    Exact
    [2]
    Suffix
    . К сожалению, большая часть этих оцифрованных неформатных электронных документов публикуется почти в том виде, в каком они получены из под сканера. И объясняется это, в первую очередь, трудностями, связанными с распознаванием (современные ОСР системы дают очень большой процент ошибок) и последующей обработкой и отображением (многие символы давно вышли из употребления
    (check this in PDF content)

  3. Start
    8403
    Prefix
    Именно этот адаптивный расширяемый словарь графических букв, шрифтов и других объектов автоматизированной обработки конкретного документа условно назван нами «автоадаптивным шрифтом», а совокупность методов его применения - «технологией построения автоадаптивного шрифта»
    Exact
    [3]
    Suffix
    . Создание неформатных электронных документов на основе технологии автоадаптивных шрифтов В работе предпринята попытка на основе математического аппарата модели алгоритма вычисления оценок (АВО), впервые предложенной в работах Ю.
    (check this in PDF content)

  4. Start
    8650
    Prefix
    Создание неформатных электронных документов на основе технологии автоадаптивных шрифтов В работе предпринята попытка на основе математического аппарата модели алгоритма вычисления оценок (АВО), впервые предложенной в работах Ю.И. Журавлева
    Exact
    [4]
    Suffix
    , построить модифицированные методы и алгоритмы, позволяющие эффективно обрабатывать неформатные графические документы в аппаратно-программных комплексах (АПК) с конвертацией бумажных документов в электронные.
    (check this in PDF content)

  5. Start
    9874
    Prefix
    ; отсутствие математических моделей, представляющих единым образом все виды объектов неформатных графических документов, с построением для каждого объекта вектора признаков и с использованием выбранной метрики для оценки похожести этих объектов; неопределенная процедура выбора необходимого количества членов разложения в ряд Фурье для решения поставленной задачи и др.
    Exact
    [5]
    Suffix
    . Для получения векторов признаков графических объектов используется контурный подход. Контур графического объекта рассматривается как вектор-функция, заданная параметрически:   ,1, 2, ..., ,1, 2, ..., x y W ttm W ttm xt yt   (1) Очевидно, что подобное описание объекта не может обойтись без дополнительных преобразований, чтобы использоваться в качестве векто
    (check this in PDF content)

  6. Start
    11182
    Prefix
    Выбор в пользу преобразования Фурье сделан, главным образом, в силу равномерной сходимости ряда Фурье при приближении кусочно-линейной функции, ортогональности его компонент и ряда других особенностей этого метода. Коэффициенты разложения Фурье bk для кусочно-линейной функции вычисляются по формуле
    Exact
    [6]
    Suffix
    : 1 221 0 ( 1) 2 ( )2 (sinsin) km kiii i fm bktkt kk         (2) Из равномерной сходимости компонент Фурье-преобразования как 1/х, следует необходимый для практических расчетов вывод о том, что если эти коэффициенты bk для кусочно-линейной функции вычисляются точно, и если использовать их в качестве компонент вектора признаков, то их количество определяет
    (check this in PDF content)

  7. Start
    12008
    Prefix
    При этом, восстанавливать объекты обратным Фурье преобразованием необходимо не точнее шага сетки сканирования. В связи с этим доказывается теорема об оценке необходимого количества m членов разложения в ряд Фурье
    Exact
    [7]
    Suffix
    : d n m 8 2 2 (3) где ε - требуемая точность, d - линейный размер графического объекта, n - количество точек в контуре и m – количество компонент, обеспечивающих требуемую точность приближения.
    (check this in PDF content)

  8. Start
    15216
    Prefix
    2 после добавления нового члена кластера:    12 2 1 22 1 2222 1 11 1 1 111 1 1 111 . 1 m jjj t m jjjj t jjjj mv tm m v tmv mm m mmmvmmm m                        (7) Данный алгоритм позволяет пересчитывать уточненные параметры кластера после добавления нового его представителя
    Exact
    [8]
    Suffix
    . Для построения АПК были разработаны методы предварительной обработки исходных данных неформатных графических документов. Один из них это метод выделения графических объектов и получение их контуров из бинаризованного электронного документа методом маркированных квадратов [9].
    (check this in PDF content)

  9. Start
    15559
    Prefix
    Для построения АПК были разработаны методы предварительной обработки исходных данных неформатных графических документов. Один из них это метод выделения графических объектов и получение их контуров из бинаризованного электронного документа методом маркированных квадратов
    Exact
    [9]
    Suffix
    . Алгоритм выделения графических объектов и получение их контуров предполагает рассмотрение и анализ четырех ближайших точек сетки. Узлы сетки раскрашиваются (маркируются) в зависимости от значения исследуемой функции в данном узле.
    (check this in PDF content)