Система фильтрации информации - Information filtering system

An система фильтрации информации это система, которая удаляет избыточный или нежелательный Информация из информационного потока с использованием (полу) автоматизированных или компьютеризированных методов до представления пользователю-человеку. Его основная цель - управление информационная перегрузка и увеличение семантический соотношение сигнал шум. Для этого профиль пользователя сравнивается с некоторыми эталонными характеристиками. Эти характеристики могут происходить из информационного элемента (контент-ориентированный подход) или социальной среды пользователя ( совместная фильтрация подход).

Тогда как в передача информации фильтры обработки сигналов используются против синтаксис -разрушая шум на битовом уровне, методы фильтрации информации действуют на семантическом уровне.

Диапазон используемых машинных методов основан на тех же принципах, что и извлечение информации. Примечательное приложение можно найти в области электронной почты спам-фильтры. Таким образом, это не только информационный взрыв что требует применения фильтров, но также случайно или злонамеренно псевдо -Информация.

На уровне представления фильтрация информации принимает форму предпочтений пользователя. новостные ленты, так далее.

Рекомендательные системы и платформы обнаружения контента являются активными системами фильтрации информации, которые пытаются представить пользователю элементы информации (фильм, телевидение, Музыка, книги, Новости, веб-страница ), в котором заинтересован пользователь. Эти системы добавляют элементы информации к информации, текущей к пользователю, в отличие от удаления элементов информации из потока информации к пользователю. Рекомендательные системы обычно используют совместная фильтрация подходы или комбинация подходов совместной фильтрации и фильтрации на основе содержимого, хотя системы рекомендаций на основе содержимого действительно существуют.

История

До появления Интернет, уже существует несколько способов фильтрация информации; например, правительства могут контролировать и ограничивать поток информации в данной стране посредством формальной или неформальной цензуры.

С другой стороны, мы собираемся поговорить об информационных фильтрах, если мы обратимся к редакторам газет и журналистам, когда они предоставляют услугу, которая отбирает наиболее ценную информацию для своих клиентов, читателей книг, журналов, газет, радио слушатели и зрители телевидение. Эта операция фильтрации также присутствует в школах и университетах, где существует выборка информации для оказания помощи на основе академических критериев клиентам этой услуги, студентам. С появлением Интернета возможно, что каждый может публиковать все, что пожелает, по невысокой цене. Таким образом, значительно увеличивается менее полезная информация и, следовательно, распространяется качественная информация. С этой проблемой он начал разрабатывать новую фильтрацию, с помощью которой мы можем легко и эффективно получать информацию, необходимую для каждой конкретной темы.

Операция

Система фильтрации этого стиля состоит из нескольких инструментов, которые помогают людям находить наиболее ценную информацию, поэтому ограниченное время, которое вы можете посвятить чтению / прослушиванию / просмотру, правильно направляется на наиболее интересные и ценные документы. Эти фильтры также используются для правильной и понятной организации и структурирования информации в дополнение к групповым сообщениям на адресуемой почте. Эти фильтры необходимы для получения результатов поисковые системы в Интернете. Функции фильтрации улучшаются с каждым днем, чтобы обеспечить загрузку веб-документов и более эффективных сообщений.

Критерий

Одним из критериев, используемых на этом этапе, является знание вредно или нет, независимо от того, позволяет ли знание лучше понять концепцию или без нее. В этом случае задача фильтрация информации уменьшить или устранить вредоносную информацию со знанием дела.

Система обучения

Система содержания обучения состоит, по общим правилам, в основном из трех основных этапов:

  1. Во-первых, это система, которая предоставляет решения для определенного набора задач.
  2. Впоследствии он проходит критерии оценки, которые будут определять эффективность предыдущего этапа в отношении решения проблем.
  3. Модуль сбора, на выходе которого получены знания, которые используются в решателе системы первого этапа.

Будущее

В настоящее время проблема не в том, чтобы найти лучший способ фильтровать информацию, но способ, которым эти системы требуют независимого изучения информационных потребностей пользователей. Не только потому, что они автоматизируют процесс фильтрация но также конструкция и адаптация фильтра. Некоторые отрасли, основанные на нем, такие как статистика, машинное обучение, распознавание образов и интеллектуальный анализ данных, являются базой для разработки информационных фильтров, которые появляются и адаптируются в зависимости от опыта. Чтобы можно было провести процесс обучения, часть информации должна быть предварительно отфильтрована, это означает, что есть положительные и отрицательные примеры, которые мы назвали обучающими данными, которые могут быть сгенерированы экспертами или с помощью Обратная связь через обычных пользователей.

Ошибка

По мере ввода данных система включает новые правила; если мы считаем, что эти данные могут обобщить информацию об обучающих данных, то мы должны оценить развитие системы и измерить способность системы правильно прогнозировать категории новых Информация. Этот шаг упрощается путем разделения обучающих данных в новую серию, называемую «тестовые данные», которую мы будем использовать для измерения частоты ошибок. Как правило, важно различать типы ошибок (ложные срабатывания и ложноотрицания). Например, в случае на агрегаторе контента для детей, он не имеет ту же силу тяжести, чтобы позволить прохождение информации не подходит для них, что шоу насилия или порнография, чем ошибка отказаться от некоторых присвоил information.To улучшить система для снижения частоты ошибок и наличия этих систем с возможностями обучения, аналогичными человеческим, нам требуется разработка систем, имитирующих когнитивные способности человека, такие как понимание естественного языка, улавливание смысла Общие и другие формы расширенной обработки для достижения семантики информации.

Сферы использования

В настоящее время существует множество методов разработки информационных фильтров, некоторые из которых позволяют достичь коэффициента ошибок ниже 10% в различных экспериментах.[нужна цитата ] Среди этих методов есть деревья решений, машины опорных векторов, нейронные сети, байесовские сети, линейные дискриминанты, логистическая регрессия и т. Д. В настоящее время эти методы используются в различных приложениях не только в веб-контексте, но и в тематических вопросах, таких как варьировались как распознавание голоса, классификация телескопической астрономии или оценка финансового риска.

Смотрите также

Рекомендации

  • Ханани, У., Шапира, Б., Шовал, П. (2001) Фильтрация информации: Обзор проблем, исследований и систем. Пользовательское моделирование и взаимодействие с пользователем, 11, стр. 203–259.
  • http://www.infoworld.com/d/developer-world/human-information-filter-813

внешняя ссылка