В данной работе решается проблема извлечения именованных сущно-
стей из текста на естественном языке. Приводится обзор существующих
классических и статистических подходов к обработке текстовой информа-
ции, а также их особенностей, достоинств и недостатков. Среди статистиче-
ских методов выделяется класс условных случайных полей (CRF), а в нем
- пробросо-цепочечные условные случайные поля (SC-CRF), дается мате-
матическое описание алгоритма. Предлагаются варианты построения свя-
зей в SC-CRF, в частности, на основе нормы разности векторов факторов.
Производится тестирование работы алгоритма на данных из свободных ис-
точников, приводятся результаты данного тестирования.