Хотите узнать как нестандартно монетезировать?

Корпоративный поиск

SEO SMM SMO 16-05-2015, 10:50 425   

На сегодняшний вряд ли найдется компания, не использующая ИТ технологии в процессе своей деятельности. Взрывной рост объемов корпоративной информации, хранящейся на серверах, в некотором смысле определил развитие рынка систем хранения данных и в тоже время создал новые ниши. Одной из таких ниш является корпоративный поиск. Все чаще компании приходят к пониманию того, что в рамках их инфраструктуры необходима интуитивно понятная и привычная строка поиска.

image

Корпоративный поиск – это инструмент для бизнеса, для сотрудников предприятия – конечных пользователей, не связанных с ИТ. В первую очередь это поиск информации на файловых серверах, где по сути нет никакой структуризации, а также поиск на таких платформах как Exchange и SharePoint. Таким образом поисковый инструмент с одной стороны должен быть простым в использовании и заточенным под корпоративную специфику, а с другой стороны должен без ущерба интегрироваться с существующими системами и регламентами, уметь индексировать множество современных форматов данных и удовлетворять многим другим техническим требованиям.


Итак, возьмем сотрудника юридического отдела, которому необходимо найти шаблон договора, сделанного им самим же или его коллегой. Каким бы адекватным ни был поиск, на выходе все равно получится огромная выборка похожих документов для разных контрагентов, множество версий одного и того же документа, его копии в разных местах, в том числе самых неожиданных. Налицо пресловутая корпоративная специфика. В идеале далее в силу вступает расширенный поиск – некоторые фильтры по содержимому и метаданным файла.

По содержимому файла можно:

— задать слова и словосочетания, которые обязательно должны встретиться в документе;
— задать слова и словосочетания, из которых хотя бы одно должно встретиться в документе;
— задать слова и словосочетания, которых НЕ должно быть в документе;
— задать, где именно искать термины: название документа, текст документа.

По метаданным файла можно указать:

— формат документа;
— язык документа;
— временные рамки, когда документ был последний раз изменен;
— автора документа;
— формат документа.

Также на основе индексов поиск мог бы искать дубликаты и похожие документы. После такой фильтрации нужный документ (версия) будет найден очень быстро.

Но посмотрим теперь на проблему с другой стороны. А не найдет ли сотрудник документы, доступа к которым у него быть не должно? Или, например, умышленно введет в поисковой строке фразы «паспортные данные», «для служебного пользования» и т. д. В такой ситуации нужно, чтобы поиск использовал базу метаданных, в которой содержится вся информация о правах каждого пользователя, членстве в группах AD, статистике (логах) доступа к ресурсам предприятия. Таким образом каждый пользователь системы видит только ту информацию, которую должен видеть. Более того можно на уровне администрирования поискового ресурса исключить из результатов поиска информацию, попадающую под правила классификации, например, паспортные данные.

Дополнительно использование метаданных дает ряд преимуществ:

— инкрементальная индексация: за счет аудита событий мы знаем где произошли изменения, появились новые файлы;
— высокая скорость повышения релевантности поиска и высокая релевантность поиска: аналитическое ядро использует данные аудита действий пользователей, а также данные из AD о членстве в группах. Для каждого пользователя строится модель поведения: состоит в таких-то группах, пользуется такими-то файлами. Соответственно, «похожие» пользователи получают похожие выборки. Например, сотрудники разных отделов (а заодно члены разных групп безопасности) со временем видят разные выборки на одинаковые запросы при условии равенства прав;
— поддержка любых форматов данных, в том числе специфичных для какой-либо области: для индексации используется полнотекстовый поиск на основе iFilter. Соответственно, если для формата существует реализация iFilter, значит, его можно проиндексировать.

Интеграция с AD значительно повышает безопасность поиска. Например, пользоваться поиском могут только пользователи домена, все поисковые запросы логируются. Служба ИБ всегда сможет отследить, кто искал паспортные данные и т. д.

В результате мы имеем простой и эффективный инструмент для бизнеса и в тоже время кроссплатформенный, масштабируемый и защищенный инструмент для ИТ с возможностью аудита.

  • Не нравится
  • 0
  • Нравится

Похожие публикации

У данной публикации еще нет комментариев. Хотите начать обсуждение?

Добавить комментарий

Свежие статьи на e-mail :
Введите свой e-mail адрес :