Страница публикации
Метод извлечения статистических таблиц из неформатированного текста
Авторы: Хмельнов А.Е., Шигаров А.О.
Журнал: Тр. XII Байкальской Всерос. конф. "Информ. и матем. технологии в науке и управлении" (Иркутск-Байкал, 2-11 июля 2007 г.)
Том: 2
Номер:
Год: 2007
Отчётный год: 2007
Издательство: Ин-т систем энергетики им. Л.А. Мелентьева СО РАН
Местоположение издательства: Иркутск
URL:
Проекты:
DOI:
Аннотация: The problem of table extraction is a part of the field of document analysis. Different approaches to this problem are usually based on certain media and file formats. In this paper a heuristic method for plain text table extraction from unformatted and formatted documents is considered. This method uses some particular properties of the statistical tables, and it can also be applied to the tables of the similar structure. Additionally, the model of the table structure is proposed, which allows to transform automatically the contents of the extracted tables into relational tables.
Индексируется WOS: Нет
Индексируется Scopus: Нет
Индексируется УБС: Нет
Индексируется РИНЦ: Да
Индексируется ВАК: Нет
Индексируется CORE: Нет
Публикация в печати: 0