Страница публикации

Метод извлечения таблиц из неформатированного текста

Тип публикации: Статья в журнале

Тип материала: Текст

Авторы: Хмельнов А.Е., Шигаров А.О.

Журнал: Вычисл. технологии

Язык публикации: russian

Том: 13

Номера страниц: 93-101

Количество страниц: 9

Номер: S1

Год публикации: 2008

Отчетный год: 2008

Аннотация: The problem of tables extraction is a part analysis of documents. Different approaches to this problem are usually based on certain media and formats. A heuristic method for a plain text table extraction from an unformatted and formatted documents is considered in this paper. This method uses some particular properties of the statistical tables, and it can also be applied to the tables of the similar structure. Additionally, the model of the table structure is proposed, which allows to transform automatically the contents of the extracted tables into relational tables.

Индексируется WOS: Нет

Индексируется Scopus: Нет

Индексируется УБС: Нет

Индексируется РИНЦ: Да

Индексируется ВАК: Нет

Индексируется CORE: Нет

Специальный выпуск: 1