Инструменты нелинейного поиска и построение связей

Особую ценность для профессиональных журналистов и поиско­виков представляют системы, позволяющие выбирать данные о свя­зях между объектами. Именно построение связей, систематизация фактов и является конечной задачей поисковика. В некоторой степе­ни эту задачу можно автоматизировать.

Так, например, в «Интегруме» разработан инструмент, позво­ляющий выбирать из текстов отдельных документов информацию вида человек — должность — организация (ФДО).

Фактически ФДО — это база данных, в которой хранятся объекты «человек» и «организация», связанные отношением «занимать долж­ность». Другими словами, это база, из которой можно узнать, в каких организациях (и на каких должностях) работал определенный чело­век и какие люди (и на каких должностях) работали в определенной организации. База позволяет также получить все документы, из кото­рых была почерпнута соответствующая информация.

Производными от ФДО являются сервисы «Коллеги?» (поиск общих мест работы для двух человек) и «Связанные организации?» (поиск общих сотрудников для двух компаний).

Сходные функции имеет разработанный компанией Xanalys инст­румент анализа связей Quenza. Он позволяет получать и накапливать данные из текстов о людях, событиях и организациях и идентифици­ровать связи в пределах этих данных. Quenza работает с информацией, сохраненной в MS Word, PDF, электронной почте и формате HTML.

Безусловный интерес для профессионалов представляет инстру­мент визуализации анализа информации Watson, разработанный той же компанией Xanalys. Watson позволяет в графической форме выяв­лять связи между внешне не связанными наборами данных.

Например, Watson дает возможность накладывать информацию о транзакциях из одного файла на информацию о телефонных перего­ворах из другого файла. Полученная в результате база данных позво­ляет запрашивать информацию о соответствующих связях.

Развитие технологий и объемы информации, которую приходит­ся перерабатывать журналистам и профессиональным поисковикам, требуют появления новых и новых инструментов для ее оптимальной обработки, поэтому здесь мы приводим лишь отдельные примеры наиболее оригинальных инструментов.

К средствам нелинейного поиска также можно отнести инстру­менты рейтингов и статистики. Так, например, «Медиалогия» пре­доставляет клиентам инструмент расчета индексов отношения прес­сы к персонам, компаниям или торговым маркам, «Интегрум» позво­ляет автоматически определять персон, лидирующих в информаци­онном поле дня, не по заранее заданному списку, а выбирая из СМИ все упоминания о физических лицах.

Самые продуктивные результаты, как уже говорилось в начале данного раздела, дает совмещение онлайновых и офлайновых мето­дов и инструментов работы с информацией.

Узнай цену консультации

"Да забей ты на эти дипломы и экзамены!” (дворник Кузьмич)