Создание структурированной информации. Структурирование информации: простой и эффективный метод анализа

Многообразие методов структурирования информации обусловлено тем, что способов ее представления и организации существует масса, да и информация, сама по себе, бывает весьма различного свойства. Например, весьма существенно то, какие средства отображения/каналы восприятия задействуются при выводе/вводе данных, потенциально содержащих информацию, каков исходный уровень организации этих данных, относятся ли они к разряду числовых, текстовых, графических, видео, аудио и т. д. Очень важную роль играют те цели, которые преследуются при выполнении процедуры структурирования данных (информации).

Краткое отступление: ранее мы уже указывали на различие между данными и информацией, говоря о том, что понятие «данные» связано с представлением информации на материальных носителях, а также о том, что данные для конкретного потребителя могут вообще не содержать информации, поскольку информация - это те новые знания, которые приобретает получатель данных. Здесь мы считаем нелишним напомнить об этом и, по привычке оперируя словом «информация», будем подразумевать, что структурируем мы все-таки данные (хотя в голове мы можем структурировать и информацию, пытаясь мысленно систематизировать, упорядочить имеющиеся знания).

Для начала введем классификацию целей структурирования информации . Здесь могут быть выделены следующие классы целей:

Получение качественно нового знания о системе/процессе;

Установление факта и локализация неполноты и/или противоречивости совокупности знаний;

Систематизация, упорядочение некоторой совокупности знаний;

Акцентирование или выделение одного или нескольких аспектов информации (например, временного, пространственного, функционального и т. д.);

Сокращение избыточности представления информации;

Согласование представления информации с некоторой системой обработки и интерпретации;

Повышение наглядности отображения информации;

Смена уровня общности/абстракции описаний.

В зависимости от класса цели меняются методы и технологии структурирования информации. Но мы уже указывали на то, что цель - это не единственный фактор, определяющий выбор метода структурирования информации. По этой причине необходимо рассмотреть виды информации, подлежащей структурированию, а также способы ее представления.

Введем классификацию видов информации по ее сущности/содержанию и способу ее использования:

Информация о ценностях и целях (информация целеполагания), используемая при планировании/прогнозировании;

Информация о функциях системы/процесса;

Информация о структуре системы/процесса;

Информация о динамике системы/процесса;

Информация о состоянии системы/процесса;

Информация о задачах системы/процесса.

В приведенной классификации виды информации размещены в порядке убывания периода стабильности/актуальности. Однако два класса информации, описывающей ценности, цели и задачи, являются относительно независимыми от состояния, динамики, структуры и функций системы/процесса, поскольку связаны с реализацией функции целеполагания. Впрочем, можно считать, что решение об использовании именно такой схемы размещения этих классов информации вполне обоснованно, поскольку позволяет решать многие прикладные задачи.

Кроме всего прочего, следует учитывать еще и такие классификационные признаки, как:

- отношение информации к объекту:

Информация, относящаяся к объекту;

Информация, относящаяся к классу объектов;

Информация, относящаяся к среде;

- отношение информации к некоторому моменту времени:

Информация, относящаяся к прошлому;

Информация, относящаяся к настоящему;

Информация, относящаяся к будущему;

- отношение информации к классу структурной организации:

Информация неструктурированная;

Информация структурированная;

Информация упорядоченная;

Информация формализованная.

Теперь, после того как мы определились с тем, что же, собственно, нам предстоит структурировать, можно перейти к рассмотрению методов структуризации .

Можно ли сказать, что структуризация информации/данных - это нечто новое или незнакомое нам? - Конечно, нет. Собственно, все те действия, которые мы проделывали в начале этого подраздела, представляли собой одну из множества ипостасей процесса структуризации информации. В нашем случае мы занимались структурированием знаний - мы решали задачу изменения уровня организации знаний, пытаясь построить компактную систему знаний, которая могла бы выступать в качестве основы для дальнейшего развития теории (американцам очень нравится слово «скелет/skeleton», которым они пользуются в таких случаях).

Следует признать, что у американцев язык науки гораздо более метафоричен, нежели чем у нас, а ведь метафора, как мы указывали, - это ступень к новому знанию. Если мы знаем, с чем можно сравнить нечто, то вполне вероятно, что на это нечто могут быть перенесена некоторая часть наших знаний об объекте, с которым мы сравниваем это нечто. Наш «великий и могучий русский язык» гораздо более академичен, а процесс словообразования достаточно сложен и не всегда приводит к желаемому результату (закреплению нового, более «экономного» слова). Это довольно грустно, поскольку одним из первых признаков научного и культурного застоя является прекращение словотворчества и преобладание процесса приращения словаря за счет иноязычных заимствований. Надо сказать, что даже предмет национальной «гордости» россиян - русский мат - по запасу ругательных слов, оказывается, уступает большинству языков мира. Зато мы чаще пользуемся этими словами - запальчиво возразит «патриот»... что ж, возможно, но это тоже аргумент не в нашу пользу.

Итак, зачем мы так старательно расклассифицировали цели структурирования информации? Да затем, чтобы создать тот самый скелет, который нам предстоит в дальнейшем оснастить «сухожилиями», «мышцами» и обтянуть «кожей» - то есть дополнить более конкретными знаниями. Что ж, скелет мы уже смастерили - пора приступать к следующему этапу.

В основе большинства процедур структурирования лежит метод классификации. Классификация - это иерархически организованная система информационных элементов, обозначающих объекты/процессы реального мира и упорядоченных по признаку сходства/различия классификационных признаков, отражающих избранные свойства объектов . Как правило, процедура классификации (классифицирование) осуществляется для удобства исследования некоторой предметной области (фрагмента реального мира). Принято различать следующие виды классификации:

Искусственную, осуществляемую по внешним признакам, не выражающим сущности объектов/процессов, и служащую для упорядочения некоторого их множества;

Натуральную (естественную), осуществляемую по существенным признакам, характеризующим внутреннюю (сущностную) общность объектов/процессов.

Натуральная классификация является инструментом и результатом научного исследования, поскольку выражает результаты изучения закономерностей классифицируемых объектов/процессов. В то время как искусственная классификация обладает исключительно прикладной ценностью в рамках решения конкретной задачи. Например, спелое/неспелое яблоко - натуральная классификация, красное/зеленое яблоко - искусственная.

От качества выполнения процедуры классификации на ранних этапах исследований сложных систем (да и не только сложных) зависит результативность и качество всей работы. Поэтому при осуществлении процедуры классификации необходимо придерживаться следующих принципов :

При выполнении каждой операции разделения на классы (акт деления) допускается применение только одного классификационного основания;

Совокупный объем полученных в результате разделения на классы понятий должен равняться объему делимого понятия;

Понятия, полученные в результате деления должны взаимно исключать друг друга;

Деление должно быть последовательным.

Классификации делятся на следующие виды:

Простые (одноуровневые), например - дихотомия, когда одно понятие верхнего уровня (А) делится на два таких (В и С), что для них выполняются условия А = В + С и В = не С (С = не В);

Сложные (многомерные) обычно, представляемые в виде таблиц сложной организации, где строкам и столбцам соответствуют различные классификационные признаки, например - периодическая таблица химических элементов Д.И. Менделеева;

Иерархическая (древовидная), едва ли нуждающаяся в примерах и пояснениях.

Метод классификации в том или ином виде используется при решении самых разнообразных задач, связанных со структурированием информации. Неорганизованные информационные элементы подвергаются процедурам группирования, связывания, обобщения, в результате чего структура или проявляется (при натуральной классификации), или образуется (при искусственной классификации). В книге В.Ф. Турчина «Феномен науки: Кибернетический подход к эволюции» момент смены уровня организации системы именуется метасистемным переходом (возникновения системы более высокого уровня иерархии), который и рассматривается как эволюционный процесс. Соответственно, процессы синтеза новой классификации и структурирования информации можно рассматривать, как процесс эволюции знаний . Это не означает, что в результате выполнения процедур классификации или структурирования появляется новое знание, но означает, что в результате выполнения этих процедур создается новая система управления знаниями , существенно упрощающая различные манипуляции с ними, в том числе - и поиск ранее не выявленных закономерностей и законов.

Заметим, что процедура классификации не имеет собственной ценности и приобретает ее только, если она способствует достижению некоторого комплекса целей. Созданная в результате выполнения классификационной процедуры система управления знаниями должна быть полезной - что означает, что выбор классификационных критериев не может быть произвольным, а должен осуществляться с учетом решаемой задачи. Они должны отвечать целям деятельности. При этом следует различать два вида/аспекта деятельности :

Деятельность, направленную на достижение конечной (генеральной или глобальной) цели;

Деятельность, направленную на решение задач обеспечения этой деятельности.

К последней категории может быть отнесена деятельность, направленная на решение задач построения адекватной модели предметной области, ее тезауруса, создания инструментальных средств, используемых для достижения конечной цели.

При структурировании информации должна учитываться специфика потребителя полученного информационного продукта . Иными словами, полученный информационный продукт должен отвечать требованиям к уровню детализации информации, способу ее представления и составу тезауруса, обеспечивающим оптимальный режим восприятия информационного продукта.

Ранее, при рассмотрении видов моделей и методов моделирования мы установили, что уровень формализации представления знаний может изменяться в пределах от неструктурированного текста, представленного на естественном языке (ЕЯ) до структурированного текста на некотором искусственном (формальном) языке (ИЯ). Искусственные языки могут быть построены в базисе различных формальных систем (формальной логики, теоретико-множественного, алгебраического формального аппарата и иных).

В зависимости от исходного уровня структурной организации обрабатываемых данных, могут быть выделены следующие классы задач (классы задач по уровню структурной организации информации на входе/выходе ):

1. Задачи преобразования неструктурированного ЕЯ-текста в ЕЯ-текст с разбиением на рубрики;

2. Задачи преобразования ЕЯ-текста с разбиением на рубрики в структурированный ЕЯ текст с элементами логического формализма;

3. Задачи преобразования структурированного ЕЯ текста с элементами логического формализма в символьную модель, использующую формализм теории графов с ЕЯ-маркировкой вершин (узлов) и связей (дуг);

4. Задачи преобразования символьной модели, использующей формализм теории графов с ЕЯ-маркировкой вершин (узлов) и связей (дуг), в символьную модель, использующую формализм теории графов с ИЯ-маркировкой вершин (узлов) и связей (дуг);

5. Задачи преобразования символьной модели, использующей формализм теории графов с ИЯ-маркировкой вершин (узлов) и связей (дуг), в строгую символьную ИЯ-модель.

В принципе, уже после решения задачи второго типа, может осуществляться переход от ЕЯ-представлений к некоторой промежуточной системе обозначений (имен), как это делается при разработке программ. Однако такой переход имеет смысл только при условии, что уже произведена декомпозиция на элементарные термины, выражающие свойства и функции объектов, с тем, чтобы в дальнейшем для них не потребовалось осуществлять процедуру восстановления ЕЯ-представления. Если это условие выполняется, то становится возможен даже автоматизированный переход от промежуточной системы имен к ИЯ-представлению (при условии существования тезауруса соответствующего уровня) . В общем же случае, операция детальной декомпозиции осуществляется лишь при решении задачи четвертого типа. Впрочем, жесткий стандарт здесь установить трудно, да и не может он быть жестким, поскольку специфику алгоритма структуризации определяют цели деятельности.

Более того, в случае, когда достигнутая степень формализации не удовлетворяет требованиям, предъявляемым спецификой деятельности, полученное формальное описание может быть повторно подвергнута процедурам, которые ранее осуществлялись в отношении представления иного типа.

Заметим, что структурированию может подвергаться и информация, представленная в нетекстовом виде, однако и здесь могут быть выделены задачи, по своему содержанию равносильные перечисленным .

Например, рассматривая в качестве исходного массива данных массив графических изображений различных фрагментов некоторого объекта/процесса, относящихся к разным моментам времени и полученных с разных ракурсов, можно решить задачу структурирования , воспользовавшись теми же этапами/задачами. Для чего можно воспользоваться одной из двух стратегий:

Осуществить предварительную трансляцию в текстовую форму (составление подробных описаний изображений на ЕЯ с указанием пространственных и временных отношений между описываемыми объектами), после чего воспользоваться ранее описанными процедурами;

Интерпретировать изображение, как разновидность текста, с применением альтернативной знаковой системы, позволяющей осуществить процесс структуризации в другой знаковой системе.

В качестве теоретического основания для применения такого подхода выступает семиотика, интерпретирующая любой способ представления информации как разновидность текста, представленного средствами некоторой знаковой системы. Для графического представления информации разработан ряд методов, позволяющих перейти от обычного цветного тонального изображения к контурным и иным представлениям, упрощающим процедуры распознавания и трансляции к иным знаковым системам. Однако, поскольку графические модели, получаемые методом последовательной фиксации состояния объектов реального мира, способны отражать лишь пространственно-временные и атрибутивные характеристики наблюдаемых объектов/процессов, постольку извлечение из них системы причинно-следственных отношений становится возможным только с привлечением внешней (чаще всего - экспертной) модели интерпретации.

Наиболее распространенным путем решения задач структуризации информации является привлечение эксперта-аналитика. В этом случае на него ложится вся нагрузка по преобразованию исходного текста: от поиска связных фрагментов до выявления системы логических, пространственных, временных отношений и дальнейших процедур синтеза формальной модели. Хотя в последнее время, благодаря развитию семиотики, лингвистики, теории искусственных языков, теории систем искусственного интеллекта, нейрокибернетики и ряда других научных дисциплин, в эту отрасль стали все чаще вторгаться технологии если не автоматического, то автоматизированного анализа и структурирования информации. Среди такого рода технологий можно выделить системы автоматизированного реферирования текста, предназначенные для извлечения фрагментов текста, наиболее ярко выражающих сущность текста или его основные положения. Как правило, эта операция осуществляется за счет применения статистических закономерностей, открытых Дж. Зипфом (George Kingsley Zipf) и получивших название принципа экономии усилий в лингвистике или закона Зипфа (или, более общей формулировке, закона Зипфа-Мандельброта ).

В зависимости от реализации статистические критерии могут применяться к тексту на раннем этапе (до грамматико-логической обработки текста), а могут и на завершающей стадии (после предварительной обработки, согласования словоформ и т. п.). Однако, в настоящее время без поддержки интерактивного режима (диалога с экспертом) качество реферирования достаточно низко и не всегда удовлетворяет потребителя. Вне зависимости от спектра технологий, используемых при анализе словоформ (формальные ли грамматики, нейросетевые ли технологии), результаты семантической обработки пока далеки от тех, которые в состоянии обеспечить эксперт, что отчасти объясняется тем, что любая из созданных на сегодня баз знаний, в известном смысле, наивнее ребенка. Причиной такой «наивности» является то, что механизмы обучения подобных систем и способы организации знаний в них несовершенны, а количество каналов приобретения знаний слишком мало. Существуют прототипы самообучающихся интеллектуальных систем, но до уровня интеллекта разумных существ эти системы пока не могут дорасти.

Однако оставим подробное рассмотрение этих вопросов специалистам в области теории систем искусственного интеллекта. Заметим лишь, что работы в области теории систем искусственного интеллекта действительно заслуживают того, чтобы с ними ознакомились люди, занятые в «сфере информационного производства» . Чрезвычайно интересны эти работы хотя бы потому, что представляют собой попытки осмыслить то, каким образом человек осуществляет свою мыслительную деятельность, алгоритмизировать и упорядочить ее, что крайне важно и для эксперта-аналитика. Кроме того, нелишне хотя бы в общих чертах представлять, каким образом работает твой инструмент, каковы его параметры и особенности функционирования. Так, например, ряд направлений современной психологии выросли не из классической психологии, а из гибрида теории искусственного интеллекта, классической психологии и философской теории познания. И столь необычное происхождение этих психологических теорий, отнюдь, не мешает специалистам в этой области успешно решать задачи именно психологического плана.

Методы первичного структурирования информации широко используются при синтезе баз данных и подробно рассматриваются в разнообразных изданиях по информатике, в частности - тех, которые посвящены вопросам проектирования и разработки баз данных различного назначения. В наиболее популярном и, в то же время, профессиональном изложении эти проблемы рассматриваются в книге американского автора Дэвида Васкевича, написанной именно для тех людей, которые руководят деятельностью или формулируют задачи перед специалистами в области разработки программного обеспечения, но не обязаны вникать в технологические подробности процесса разработки. В частности, в книге Васкевича описываются различные способы организации и структурирования данных, виды отношений между ними, приведены наглядные примеры, что позволяет руководителю по ее прочтении квалифицированно руководить коллективом разработчиков и грамотно организовать технологический процесс. Но подчеркнем еще раз: для нас в этой книге содержится информация, связанная именно с проблемой структурирования информации.

Нет ничего удивительного в том, что мы обращаемся к базам данных для того, чтобы проиллюстрировать процессы структурирования информации. Базы данных - это тоже модели , описывающие те или иные аспекты существования системы/процесса, поэтому при их создании и проектировании так же применяются методы структурирования информации, отличающиеся от прочих методов лишь тем, что структурирование осуществляется уже с учетом ограничений, налагаемых технологической платформой. В общем случае при структурировании информации такие ограничения не всегда принимаются в расчет.

Так или иначе, но полученный массив описаний предметной области или проблемы на начальном этапе структурирования информации должен быть приведен к виду, упрощающему его дальнейшую обработку. Если сведения получены в результате проведения информационно-поисковых процедур (например, в различного рода средствах массовой информации - от печатной прессы до сети Интернет), полученный исходный массив, как правило, не структурирован и разноформатен. В этом случае перед аналитиком встает задача первичного структурирования массива сообщений в ее наиболее сложном варианте (здесь требуется выделение из сообщений информации, релевантной задачам исследования, ее компоновка и т. п.).

Однако если речь идет о сборе информации методом опроса экспертов, первичное структурирование информации может быть проведено уже на предшествующем этапе за счет разработки системы опросников, анкет и иных средств упорядочивания информации. Стратегия опроса экспертов (в том числе - проведения мозговых атак или деловых игр) может быть организована таким образом, чтобы ввести экспертов в ситуацию, управляющую процессом высказывания суждений в той последовательности, при которой информация будет изначально структурирована некоторым образом, отвечающим потребностям последующей ее формализации. В некоторых случаях экспертам могут быть предъявлены на оценку заранее подготовленные варианты решения задач, массивы исходных данных и прочие материалы, нуждающиеся в оценивании и ранжировании с привлечением их опыта.

В одном случае (при анкетировании и управлении процедурой опроса или стратегией игры) информация извлекается в соответствии с заранее установленной рубрикацией. В другом случае (при оценивании вариантов) структура организации информации не изменяется и остается в рамках заранее установленной формы любого уровня структурной организации. В частности, варианты, предложенные для оценивания, могут быть сформулированы на основе исследований, предварительно проведенных на имитационных моделях, или полученных в результате собеседования с другими группами или с той же группой экспертов.

Для выделения логической структуры описаний, предварительно разделенных на рубрики (относящиеся к одним и тем же группам объектов, процессам, временным и пространственным областям) применяются различные методы, обеспечивающие возможности:

Выделения «дискретных» состояний (для текстовых описаний - это связано с определением множества терминов, используемых для описания некоторого, существенного для решаемой задачи, состояния);

Упорядочивания их во времени (построение сценариев типа «раньше - позже»);

Причинно-следственного связывания (построение сценариев типа «причина - следствие»);

Пространственного связывания и иные.

На следующем этапе в зависимости от целей деятельности подобные модели могут быть подвергнуты процедуре декомпозиции (детализации) или агрегации (композиции или свертке), в результате чего формируется описание необходимого уровня абстракции/детализации.

Дальнейшие этапы выполняются за счет введения специальных систем именования элементов модели, приписывания им поименованных атрибутов, описания функциональных зависимостей и так далее. Например, в качестве функциональных зависимостей для ряда задач могут быть рассмотрены зависимости ресурс-время-результат и иные, которые на начальных этапах могут быть использованы для маркирования дуг графа, а впоследствии - воплощены в программные коды имитационных моделей. Особый класс составляют модели ситуаций, используемые для распознавания объектов, их состояний, тенденций и процессов. В таких моделях может абсолютизироваться либо статический, либо динамический аспект существования/функционирования системы. Однако подробно рассматривать эти процедуры мы здесь не будем, тем более, что некоторые аспекты этой деятельности нами уже были описаны при рассмотрении соответствующих классов моделей.

Макарова Н.В., Волков В.Б. Информатика: учебник для вузов.- СПб.: Питер, 2011. 576 с.

Тема 1. ПРЕДСТАВЛЕНИЕ ИНФОРМАЦИИ

Понятие информации

Термин «информация» происходит от латинского «informatio», что означает «разъяснение», «осведомление», «изложение».

Существует множество определений информации. Так, один из основоположников современной теории информации, Ноберт Винер, определял информацию так: «Информация есть информация, а не материя или энергия».

Такое определение через отрицание кажется достаточно полным и универсальным, но применить его в качестве инструмента для построения научной методологии практически невозможно.

В то же время в современной технике получили широкое распространение методологические подходы, позволяющие применять понятие информации и предложенные инструменты для исследования процессов, происходящих в технических системах, экономике, социуме, в живой и неживой природе.

Наиболее известный среди таких подходов – математическая теория Клода Шеннона, позволяющая вероятностно обосновать надежность передачи сигналов по линии связи. В подходе Шеннона информация – это мера снижения неопределенности системы.

Существует также термодинамический (энергетический) подход, рассматривающий информацию как способ уменьшения энтропии системы.

Советским математиком Колмогоровым был предложен алгоритмический подход, позволяющий оценить информацию по сложности алгоритма, необходимого для ее обработки. Все эти подходы тесно связывали понятие информации со сферой применения.

С позиции материалистической философии информация есть отражение реального мира с помощью сведений (сообщений). Сообщение – это форма представления информации в виде речи, текста, изображения, цифровых данных, графиков, таблиц и т. п. В широком смысле информация – это общенаучное понятие, включающее в себя обмен сведениями между людьми, обмен сигналами между живой и неживой природой, людьми и устройствами.

Информация – это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают степень неопределенности и неполноты имеющихся знаний.

Информатика рассматривает информацию как концептуально связанные между собой сведения, понятия, изменяющие наши представления о явлении или объекте окружающего мира. Наряду с информацией в информатике часто употребляется понятие данных. Покажем, в чем их различие.

Данные могут рассматриваться как признаки или записанные наблюдения, которые по каким-то причинам не используются, а только хранятся. В том случае, если появляется возможность использовать эти данные для уменьшения неопределенности знаний о чем-либо, данные превращаются в информацию.

Данные – это информация, закодированная определенным образом с целью передачи, обработки, поиска или извлечения.

Пример. Напишите на листе бумаги десять номеров телефонов в виде последовательности десяти чисел и покажите их вашему другу. Он воспримет эти цифры как данные, так как они не предоставляют ему никаких сведений. Затем против каждого номера укажите название фирмы и род деятельности. Для вашего друга непонятные цифры обретут определенность и превратятся из данных в информацию, которую он в дальнейшем мог бы использовать.

При работе с информацией всегда имеются ее источник и потребитель (получатель). Пути и процессы, обеспечивающие передачу сообщений от источника информации к ее потребителю, называются информационными коммуникациями.

Для потребителя информации очень важной характеристикой является ее адекватность.

Адекватность информации – это определенный уровень соответствия создаваемого с помощью полученной информации образа реальному объекту, процессу, явлению и т.п.

В реальной жизни вряд ли возможна ситуация, когда вы сможете рассчитывать на полную адекватность информации. Всегда присутствует некоторая степень неопределенности. От степени адекватности информации реальному состоянию объекта или процесса зависит правильность принятия решений человеком.

Меры информации (с. 20-25)

Качество информации

Качество информации – это совокупность свойств, которые обусловливают способность информации удовлетворять определенные потребности людей.

Основными потребительскими показателями качества информации являются: репрезентативность, содержательность, достаточность, доступность, актуальность, своевременность, точность, достоверность, устойчивость.

Репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойств объекта. Важнейшее значение здесь имеют правильность концепции, на базе которой сформулировано исходное понятие; обоснованность отбора существенных признаков и связей отображаемого явления.

Нарушение репрезентативности информации приводит нередко к существенным ее погрешностям.

Содержательность информации отражает семантическую емкость, равную отношению количества семантической информации в сообщении к объему обрабатываемых данных. С увеличением содержательности информации растет семантическая пропускная способность информационной системы, так как для получения одних и тех же сведений требуется преобразовать меньший объем данных.

Достаточность (полнота) информации означает, что ее состав (набор показателей) минимален, но достаточен для принятия правильного решения. Понятие полноты информации связано с ее смысловым содержанием (семантикой) и прагматикой. Как неполная, то есть недостаточная для принятия правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений.

Доступность информации восприятию пользователя обеспечивается выполнением соответствующих процедур ее получения и преобразования. Например, в информационной системе информация преобразуется к доступной и удобной для восприятия пользователем форме.

Актуальность информации определяется степенью сохранения ценности информации для управления на момент использования и зависит от динамики изменения ее характеристик, а также от интервала времени, прошедшего с момента возникновения данной информации.

Своевременность информации означает ее поступление не позже заранее назначенного момента времени, согласованного с временем решения поставленной задачи.

Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т. п. Для информации, отображаемой цифровым кодом, известны четыре классификационных понятия точности:

– формальная точность измеряется значением единицы младшего разряда числа;

– реальная точность определяется значением единицы последнего разряда числа, верность которого гарантируется;

– максимальная точность представляет собой точность, которую можно получить в конкретных условиях функционирования системы;

– необходимая точность определяется функциональным назначением показателя.

Достоверность информации определяется ее свойством отражать реально существующие объекты с необходимой точностью. Измеряется достоверность информации доверительной вероятностью необходимой точности, то есть вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.

Устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности. Устойчивость информации, как и репрезентативность, обусловлена выбранной методикой ее отбора и формирования.

Репрезентативность, содержательность, достаточность, доступность, устойчивость, целиком определяются на методическом уровне разработки информационных систем. Параметры актуальности, своевременности, точности и достоверности также в большей степени обусловливаются на методическом уровне, однако на их величину существенно влияет еще и характер функционирования системы, в первую очередь ее надежность. При этом параметры актуальности и точности жестко связаны, соответственно, с параметрами своевременности и достоверности.

Информационные процессы

Процессы, связанные с поиском, хранением, передачей, обработкой и использованием информации, называются информационными.

Поиск информации – это процесс извлечения хранимой информации.

Сбор информации – это деятельность субъекта, в ходе которой он получает информацию об интересующем его объекте.

Хранение информации – это процесс поддержания исходной информации в виде, обеспечивающем выдачу данных по запросам конечных пользователей в установленные сроки.

Способ хранения информации зависит от ее носителя (книга – библиотека, картина – музей, фотография – альбом). ЭВМ может рассматриваться как устройство для компактного хранения информации с возможностью быстрого доступа к ней.

Передача (обмен) информацией – это процесс, в ходе которого передатчик (источник) передает информацию, а получатель (приемник) ее принимает.

В процессе передачи информации обязательно участвуют источник и приемник информации. Между источником и приемником действует канал передачи информации – канал связи.

Канал связи – это совокупность технических устройств, обеспечивающих передачу сигнала от источника к получателю.

Кодирующее устройство – это устройство, предназначенное для преобразования исходного сообщения источника к виду, удобному для передачи.

Декодирующее устройство – это устройство для преобразования кодированного сообщения в исходное (рис. 1.1).

Деятельность людей всегда связана с передачей информации. В процессе передачи информация может теряться и искажаться, в качестве примеров можно привести искажение звука в телефоне, атмосферные помехи в радио, искажение или затемнение изображения в телевидении, ошибки при передачи в телеграфе.

Рис. 1.1. Передача информации по каналу связи

Каналы передачи сообщений характеризуются пропускной способностью и помехозащищенностью. Каналы передачи данных делятся на симплексные (с передачей информации в одну сторону, например телевидение) и дуплексные (по которым можно передавать информацию в оба направления, например телефон, телеграф). По каналу могут одновременно передаваться несколько сообщений. Каждое из этих сообщений выделяется (отделяется от других) с помощью специальных фильтров. Например, возможна фильтрация по частоте передаваемых сообщений, как это делается в радиоканалах. Пропускная способность канала определяется максимальным количеством символов, передаваемых по нему в отсутствие помех. Эта характеристика зависит от физических свойств канала. Для повышения помехозащищенности канала используются специальные методы передачи сообщений, уменьшающие влияние шумов. Например, вводят лишние символы. Эти символы не имеют реального содержания, но используются для контроля правильности сообщения при получении. С точки зрения теории информации избыточно все то, что делает литературный язык красочным, гибким, богатым оттенками, многоплановым, многозначным.

Обработка информации – это упорядоченный процесс ее преобразование в соответствии с алгоритмом решения задачи или с другими формальными правилами.

После решения задачи обработки информации результат должен быть выдан конечным пользователям в требуемом виде. Эта операция реализуется в ходе решения задачи выдачи информации. Выдача информации, как правило, производится с помощью внешних устройств ЭВМ в виде текстов, таблиц.

Защита информации в более узком смысле понимается как предотвращение доступа к информации лицам, не имеющим соответствующего разрешения (несанкционированный, нелегальный доступ), непредумышленного или недозволенного использования, изменения или разрушения информации.

Защита информации (в широком смысле) – это комплекс организационных, правовых и технических мер по предотвращению угроз информационной безопасности и устранению их последствий.

Наиболее эффективным средством организации информационных процессов является информационная система, оснащенная средствами ввода, поиска, размещения, обработки и выдачи информации. Наличие таких средств – главная особенность информационных систем, отличающих их от простых скоплений информационных материалов. Например, личная библиотека, в которой может ориентироваться только ее владелец, информационной системой не является. В публичных же библиотеках порядок размещения книг всегда строго определен. Благодаря ему, поиск и выдача книг, а также размещение новых поступлений реализованы в виде стандартных, формализованных процедур.

Классификация и структурирование информации

Классификация – это система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.

Пример. Всю информацию об университете можно классифицировать по многочисленным информационным объектам, которые будут характеризоваться общими свойствами:

– информация о студентах – в виде информационного объекта «Студент»;

– информация о преподавателях – в виде информационного объекта «Преподаватель»;

– информация о факультетах– в виде информационного объекта «Факультет» и т. п.

Свойства информационного объекта определяются информационными параметрами, называемыми реквизитами. Реквизиты представляются либо числовыми данными (например, вес, стоимость, год), либо признаками (например, цвет, марка машины, фамилия).

Реквизит – это логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления.

Пример. Информация о каждом студенте в отделе кадров университета систематизирована и представлена посредством одинаковых реквизитов:

– фамилия, имя, отчество;

– год рождения;

– место рождения;

– адрес проживания;

– факультет, где проходит обучение студент, и т. д.

Все перечисленные реквизиты характеризуют свойства информационного объекта «Студент».

Кроме выявления общих свойств информационного объекта, классификация нужна для разработки правил (алгоритмов) и процедур обработки информации, представленной совокупностью реквизитов.

Пример. Алгоритм обработки информационных объектов библиотечного фонда позволяет получить информацию обо всех книгах по определенной тематике, об авторах, абонентах и т. д.

Алгоритм обработки информационных объектов фирмы позволяет получить информацию об объемах продаж, прибыли, заказчиках, видах производимой продукции и т. д.

Алгоритмы обработки в том и другом случае преследуют разные цели, обрабатывают разную информацию, реализуются разными способами.

В любой стране разработаны и применяются государственные, отраслевые и региональные классификаторы. Например, классифицированы отрасли промышленности, оборудование, профессии, единицы измерения, статьи затрат и т. д.

Классификатор – это систематизированный свод наименований и кодов классификационных группировок.

При классификации широко используются понятия «классификационный признак» и «значение классификационного признака», которые позволяют установить степень сходства или различия объектов. Возможен подход к классификации с объединением этих двух понятий в одно, названное признаком классификации. Синонимом признака классификации является основание деления.

Пример. В качестве признака классификации выбирается возраст, который состоит из трех значений: до 20 лет, от 20 до 30 лет, свыше 30 лет. Можно в качестве признаков классификации использовать возраст до 20 лет, возраст от 20 до 30 лет, возраст свыше 30 лет.

Разработаны три метода классификации объектов: иерархический, фасетный, дескрипторный. Эти методы различаются разной стратегией применения классификационных признаков.

Любая классификация всегда относительна. Один и тот же объект может быть классифицирован по разным признакам или критериям. Часто встречаются ситуации, когда в зависимости от условий внешней среды объект может быть отнесен к разным классификационным группировкам. Эти рассуждения особенно актуальны при классификации видов информации без учета ее предметной ориентации, так как она часто может быть использована в разных условиях, разными потребителями, для разных целей.

В табл. 1.1 приведена одна из схем классификации циркулирующей в организации (фирме) информации. В основу классификации положено пять наиболее общих признаков: место возникновения, стадия обработки, способ отображения, стабильность, функция управления.

Таблица 1.1. Классификация информации, циркулирующей в организации

По признаку места возникновения информацию можно разделить на входную, выходную, внутреннюю, внешнюю.

Входная информация – это информация, поступающая в фирму или ее подразделения. Выходная информация – это информация, поступающая из фирмы в другую фирму, организацию (подразделение).

Одна и та же информация может являться входной для одной фирмы, а для другой, ее вырабатывающей, выходной. По отношению к объекту управления (фирма или ее подразделение: цех, отдел, лаборатория) может быть определена информация как внутренняя, так и внешняя.

Внутренняя информация возникает внутри объекта, внешняя – за пределами объекта.

Пример. Содержание указа правительства об изменении уровня взимаемых налогов для фирмы является, с одной стороны, внешней информацией, с другой – входной. Сведения фирмы, подаваемые в налоговую инспекцию о размере отчислений в госбюджет, являются, с одной стороны, выходной информацией, с другой – внешней по отношению к налоговой инспекции.

По стадии обработки информация может быть первичной, вторичной, промежуточной, результатной.

Первичная информация – это информация, которая возникает непосредственно в процессе деятельности объекта и регистрируется на начальной стадии. Вторичная информация – это информация, которая получается в результате обработки первичной информации; она может быть промежуточной и результатной. Промежуточная информация используется в качестве исходных данных для последующих расчетов. Результатная информация получается в процессе обработки первичной и промежуточной информации и служит для выработки управленческих решений.

Пример . В художественном цехе, где производится роспись чашек, в конце каждой смены регистрируется общее количество произведенной продукции и количество каждым работником расписанных чашек. Это первичная информация. В конце каждого месяца мастер подводит итоги первичной информации. Это, с одной стороны, вторичная промежуточная информация, а с другой – результатная. Итоговые данные поступают в бухгалтерию, где производится расчет заработной платы каждого работника в зависимости от его выработки. Полученные расчетные данные – результатная информация.

По способу отображения информация подразделяется на текстовую и графическую.

Текстовая информация – это совокупность алфавитных, цифровых и специальных символов, с помощью которых информация представляется на физическом носителе (бумага, изображение на экране дисплея). Графическая информация – это различного рода графики, диаграммы, схемы, рисунки и т. д.

По стабильности информация может быть переменной (текущей) и постоянной (условно-постоянной).

Переменная информация отражает фактические количественные и качественные характеристики производственно-хозяйственной деятельности фирмы. Она может меняться для каждого случая как по назначению, так и по количеству. Например, количество произведенной продукции за смену, еженедельные затраты на доставку сырья, количество исправных станков и т.п. Постоянная (условно-постоянная) информация – это неизменная и многократно используемая в течение длительного периода времени информация. Постоянная информация может быть справочной, нормативной, плановой:

– постоянная справочная информация включает в себя описание постоянных свойств объекта в виде устойчивых длительное время признаков (например: табельный номер служащего, профессия работника, номер цеха и т. п.);

– постоянная нормативная информация содержит местные, отраслевые и общегосударственные нормативы (например: размер налога на прибыль, стандарт на качество продуктов определенного вида, размер минимальной оплаты труда, тарифная сетка оплаты государственным служащим);

– постоянная плановая информация содержит многократно используемые в фирме плановые показатели (например: план выпуска телевизоров, план подготовки специалистов определенной квалификации).

По функциям управления обычно классифицируют экономическую информацию, при этом выделяют следующие группы: плановая, нормативно-справочная, учетная и оперативная (текущая).

Плановая информация – информация о параметрах объекта управления на будущий период. На эту информацию идет ориентация всей деятельности фирмы.

Пример. К плановой информации фирмы могут быть отнесены такие показатели, как план выпуска продукции, планируемая прибыль от реализации, ожидаемый спрос на продукцию и т. д.

Нормативно-справочная информация представляет собой различные нормативные и справочные данные. Ее обновление происходит достаточно редко.

Пример. Нормативно-справочной информацией на предприятии являются:

– время, предназначенное для изготовления типовой детали (нормы трудоемкости);

– среднедневная оплата рабочего по разряду;

– оклад служащего;

– адрес поставщика или покупателя и т. д.

Учетная информация – это информация, которая характеризует деятельность фирмы за определенный прошлый период времени. На основании этой информации могут быть проведены следующие действия: скорректирована плановая информация, сделан анализ хозяйственной деятельности фирмы, приняты решения по более эффективному управлению работами и пр. На практике в качестве учетной информации могут выступать информация бухгалтерского учета, статистическая информация и информация оперативного учета.

Пример. Учетной информацией являются: количество проданной продукции за определенный период времени; среднесуточная загрузка или простой станков и т. п.

Оперативная (текущая) информация – это информация, используемая в оперативном управлении и характеризующая производственные процессы в текущий (данный) период времени. К оперативной информации предъявляются серьезные требования по скорости поступления и обработки, а также по степени ее достоверности. От того, насколько быстро и качественно проводится ее обработка, во многом зависит успех фирмы на рынке.

Пример. К оперативной информации относят:

– количество изготовленных деталей за час, смену, день;

– количество проданной продукции за день или определенный час;

– объем сырья от поставщика на начало рабочего дня и т. д.

©2015-2019 сайт
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-02-16

Информатизация - это обеспечение структурированной информацией (знаниями, фактами), имеющей практическое значение при обосновании и решении задач , связанных с определенной деятельностью.

Информатизация - это увеличение количества структурированной информации в бизнесе, т. е. данных и знаний, имеющих смысл для предпринимательства.

Принадлежность менеджера к тому или иному типу может накладывать значительные неформальные ограничения на состав и структуру предоставляемых ему учетно-аналитических данных. Так, руководители, склонные к проактивным действиям, достаточно свободно ориентирующиеся в сложных ситуациях, как правило, отличаются хорошей логикой, способностью и стремлением к анализу, поэтому нуждаются в объемной, хорошо структурированной информации. Их не пугают приводимые в отчетах альтернативные варианты действий, применение в аналитических расчетах достаточно сложных алгоритмов и методов.

Трудно говорить о будущем отчетов о добавленной стоимости в Новой Зеландии (или где-либо еще). Однако в соответствующих социальных и экономических условиях они могут сыграть важную роль в представлении широкой публике дополнительной или по-новому структурированной информации о предприятии. Такие формы занимают свое место и в отчетах для сотрудников, обсуждавшихся выше.

Более совершенный способ подготовки документов связан с применением персональных электронно-вычислительных машин (ПЭВМ). По некоторым оценкам, в информационном потоке структурированная информация в электронном виде составляет около 10%. Она хранится в базе данных и размещена по полочкам (полям). Доступ к ней осуществляется с помощью ранее рассмотренных приемов, заложенных в системах управления базами данных.

В переговорах с потенциальными западными партнерами необходимо придерживаться еще одного важного правила -быстро и по существу отвечать на вопросы, обосновывая ответы хорошо продуманной и тщательно подготовленной структурированной информацией.

Наиболее распространен на практике подход, основанный на жесткой фиксации логической структуры информационного ресурса в соответствии с выбранным порядком критериев структурирования (например, по тематике документов или их источникам). Такая схема работоспособна и эффективна, если состав и порядок критериев структурирования информации потребителями совпадает с составом и упорядочением критериев структурирования, применявшимися на этапе проектирования логической структуры хранилища и его независимых элементов. Практика показывает, что такое соответствие достигается далеко не всегда. Потребность пользователя зачастую состоит в том, чтобы получить информацию из хранилища, интегрированную и структурированную в соответствии с его системой критериев , которая может не совпадать (иногда кардинально) с системой структурирования, использованной при создании информационного ресурса.

Первый подход состоит в том, что содержание документа, а также его характеристики (дата издания документа, автор и т. п.) отображаются в некую структурированную информацию, представляющую собой, например, запись реляционного файла. В этом случае поиск документа сводится к поиску структурированной информации средствами СУБД (см. предыдущие главы).

Наличие достаточно полной и должным образом структурированной информации о рисках является основой для выработки эффективных мер по управлению ими. При оценке промышленных рисков соответствующие сведения должны содержаться и в декларации промышленной безопасности, о которой пойдет речь в главе 11.

Далее происходит структурирование, т.е. внесение в соответствующие форматы (таблицы). На основе этой структурированной информации создается финансовая модель предприятия и прогнозные балансы доходов и расходов, активов и пассивов, поступлений и платежей (рис. 5.1). Полученные балансы и есть база для принятия решений.

Прежде всего, - это обслуживание процедур принятия решения . Исходную информацию для анализа ситуации и последующего принятия решения в ряде случаев можно найти, только обратившись в соответствующую фирму, которая систематически и профессионально собирает требуемую информацию. Кроме того, информационные фирмы , ориентируясь на современный уровень технологии, поставляют, как правило, структурированную информацию в электронном виде. Это создает предпосылки для своевременного получения актуальной информации и ее последующего локального накопления и электронной обработки.

Располагающая обширным объемом хорошо структурированной информации, информационная система , безусловно, реализует функции базы знаний в ТУ. Однако для выхода на качественно более высокий уровень организации информационных потоков необходимо выстраивание технологических цепочек работы с информацией, позволяющих, с одной стороны, организовать информационное наполнение ресурсов действительно востребованной информацией, а с другой - как руководителям, так и специалистам выработать и реализовать определенные приемы получения этой информации для обеспечения своей деятельности. Создание таких информационных ресурсов является результатом совместной деятельности подразделений, выпускающих информационный продукт, и подразделений в нем заинтересованных. Целью их создания является выявление типовых повторяющихся запросов на информацию, подготовка ее ответственным подразделением в согласованном формате и ее размещение в определенном месте иерархической структуры в срок до того, когда она должна быть использована заинтересованными подразделениями. В этом случае заинтересованные подразделения получают информацию в нужное им время в информационной системе , не инициируя запросов подготовившем ее подразделению. Как размещение информации, так и ее получение становятся естественным технологическим звеном в процессах завершения работы специалистов одного подразделения (выпускающего данный информационный продукт) и начала работы специалистов других подразделений, для которых данная информация является входной. Затраты времени и на размещение, и на поиск данных минимальны - 1-3 минуты, что позволяет сократить непроизводительные потери рабочего времени, связанные с поиском нужных сведений, в десятки раз. Важным моментом для поддержания высокого уровня востребованности информационного ресурса , обеспечение его надежного функционирования в качестве элемента технологической цепи передачи информации является его актуализация. Это подразумевает не только своевременное обновление данных, но и постоянное выявление как невостребованных материалов, так и новых запросов на информацию с отведением ей соответствующего места в иерархии и выбором оптимальных сроков и форм ее предоставления.

Традиционное хранилище бумажных документов Неструктурированная информация (файлы) Структурированная информация (базы данных)

Процесс приспособления форматов и значений данных к нуждам автомата, т. е. устранение произвола в представлении длины и (или) значений, мы можем условно назвать структурированием информации. Другими словами, структурирование - это просто введение каких-то соглашений о способах представления данных.

Что такое структурирование информации

Чем принципиально отличается система со структурированной информацией от системы с неструктурированной информацией

Закон информированности и упорядоченности означает, что любая социальная организация способна к выживанию только в том случае, если она обеспечена полной достоверной и упорядоченной (структурированной) информацией.

Первым этапом структурирования информации является определение цели отбора информации из общего потока. Выявив цель, производят сбор необходимой информации.

Третий этап упорядочения или структурирования информации должен обеспечить ее хранение. Этот этап предусматривает также разработку системы признаков, по которым нужная информация может быть найдена. Целесообразно в качестве одного из признаков использовать показатель ценности информации , в этом случае особо ценная информация всегда может быть под рукой. 5 131

При сборе, обработке и структурировании информации принимаются во внимание следующие характеристики объем , достоверность, ценность, насыщенность и гриф информации (рис. 4.14).

Б. Наибольшими возможностями устойчивого, поступательного развития обладает организация, обеспеченная полной, достоверной, структурированной информацией.

Функция обеспечения информацией включает координацию потребности в информации с ее предложением, а также обработку и подготовку оперативных данных. Для этого используются внутренняя информация предприятия, о рынке, факторах окружающей среды . Структурирование информации осуществляется в рамках требований бухгалтерского учета , производственного учета и установленных показателей , а также индексов отчетности. Получен-

Ключевые решения Цели и задачи. Стратегия диверсификации . Стратегия расширения. Административная стратегия. Финансовая стратегия . Метод роста. Время роста Организация структурирование информации, полномочий и ответственности. Структура потребления ресурсов рабочие потоки, система распределения , расположение помещений и оборудования. Приобретение и развитие ресурсов финансирование, помещения и оборудование, персонал, сырье Оперативные цели и задачи. Уровни цен и выпуска продукции . Оперативные уровни графики производства, уровни запасов, складирование. Маркетинговые мероприятия и стратегия. Исследования и разработки. Контроль

Характерной особенностью конца семидесятых годов стало существенное расширение понимания ситуационного управления . Фактически ситуационное управление стало рассматриваться с единых позиций семиотического моделирования и управления. Причиной этого послужило бурное развитие в теории искусственного интеллекта той области, которая носит название представление знаний . Ситуационное управление на десяток лет предвосхитило развитие этой области, впервые начав работать со структурированной информацией. В ситуационном управлении были созданы первые модели представления знаний и языков представления и манипулирования знаниями. Поэтому новые веяния в области искусственного интеллекта , активное развитие теории семантических сетей и фреймовых представлений были восприняты коллективами, накопившими большой опыт в области ситуационного управления с ходу, позволили воспринять новые идеи и использовать их в своих разработках. Столь же безболезненно произошел переход к языкам программирования нового типа (ЛИСП и его расширения ФРЛ). В этом плане специалисты, овладевшие принципами ситуационного управления , оказались на передовых рубежах работ в области искусственного интеллекта.

Чем больше и более структурированной информации дать венчурному инвестору, тем больше шансов получить от него необходимые фонды.

Чем сильнее информационная нагрузка, тем выше ценность грамотно структурированной информации разного рода справочников (рекламных, телефонных, товарных, отраслевых), словарей, энциклопедий, рубрикаторов и каталогов и т. п. Сама же реклама, включенная в некую структуру, будет эффективнее той, которая выпадает из структурного контекста. И рекламу кирпичей будут искать в рубрике строительных материалов, а рекламу рыбы - в продуктах моря. Так работает наш мозг.

В отличие от предыдущих, уже по названию разделов Анкеты мебельного торгового дома (примечательно, что она едина для всех предприятий Баварии, торгующих мебелью) (приложение 11) достаточно хорошо прослеживается намерение ее авторов оценить претендента как торгового работника . Сохраняя в анкете заинтересованность в ознакомлении с подробными семейно-личностными обстоятельствами претендента, справляясь о военных ранениях и судимостях, а также характере жилья, работники кадровой службы запрашивают объемную профильно-структурированную информацию о его образовании. Для этого в анкете выделены как самостоятельные разделы Учеба в школе, который, являясь традиционным, вместе с тем среди другого предусматривает необходимость оговорить возможный факт обучения в торговой школе (п. 2а), Торгово-коммерческое обучение и Выпускные экзамены. То есть, предполагая сбор данных об этапах получения необходимых знаний и навыков по конкретному профилю, Торговый дом справляется и о результатах, показанных кандидатом при имевших место испытаниях, а затем (что тоже традиционно) сопоставляет полученную информацию с реалиями практической деятельности кандидата, выясняя, где и в качестве кого он был занят.

Имея много общего с вопросами собеседования, биографическое анкетирование тем не менее от этого метода отличается. По Ришару, различия состоят в том, что собранные данные можно оценить статистически, для претендента есть возможность избежать антипатий со стороны интервьюера, негативная реакция не может быть переоцененной. По Шанцу, путем структурирования информации в анкетах можно избежать возникающих в интервью помех для объективной оценки кандидата.

Например, авиадиспетчер видит мир сквозь экран радара, через это информационное окно с делениями он получает нужным образом структурированную информацию для принятия решений.

В условиях современного Интернета проблема поиска информации о товаре, который хочет приобрести покупатель, решается, в основном, с будут становиться все более и более персонализированными. Уже сейчас любая компания-производитель получает огромный поток плохо структурированной информации о своих покупателях, которую просто не в силах правильно организовать и обработать. В партнерстве с другими компаниями, осуществляющими обслуживание этих потребителей (магазинами, банками, сервисными центрами и т.д.), компании в состоянии собрать всю необходимую информацию для того, чтобы получить полное представление о возможностях и потенциале потребителя и оптимальным образом стимулировать его к совершению покупки.

Для облегчения доступа к подобной структурированной информации на Web-сайтах размещают списки часто задаваемых вопросов - ЧАВО и организуют навигацию таким образом, чтобы следовать логике пользователя, зашедшего на сайт.

В дополнение к прямой и инвертированной схемам в ИПС используется атрибутный индекс. Он позволяет хранить данные о документе, не содержащиеся непосредственно в его тексте, например, имя автора, дату создания , наименование темы и другие фактические данные. Данные могут автоматически извлекаться из документа либо вноситься вручную при вводе документа в систему. Структура атрибутного индекса соответствует стандарту представления структурированной информации, т. е. это таблица с заранее заданными полями. На рис. 20.3 представлен пример организации поискового файла - атрибутного индекса, в котором все документы характеризуются одним и тем же набором реквизитов-полей автор документа, виддокумента и его номер, дата издания, название. Поиск по атрибутному индексу осуществляется средствами обработки запросов СУБД - выдаются только те документы, значения атрибутов которых удовлетворяют условиям запроса.

Отсюда ясно, что описанные выше текстовые файлы (и документы Word) содержат неструктурированную или в лучшем случае плохо структурированную информацию, не пригодную для эффективной обработки автоматом.

Чем сильнее информационная нагрузка, тем выше ценность грамотно структурированной информации разного рода справочников (рекламных, телефонных, товарных, отраслевых), словарей, энциклопедий, рубрикаторов, каталогов и т. д. Все, что способно облегчить работу мозгу, воспринимается как сверхценное (поэтому так соблазнительны обещания о научении с помощью 25-го кадра, о скорочтении и т. п.).

Не стоит думать, что самообслуживание через Интернет эффективно только для поиска специализированной информации, такой, например, как статус прохождения посылки. Большие объемы структурированной информации (инструкции, правила, списки выбора) проще воспринимаются при чтении, нежели на слух. Попробуйте выбрать кинотеатр на вечер (нужный фильм, сеанс, близость к дому), пользуясь только телефонными автоинформаторами, - это займет в лучшем случае час. Та же операция через Web-сайт займет пару минут.

Аннотация: В этой лекции мы рассмотрим такие вопросы: ассоциации как основа работы человеческого мозга, понятие о теориях обработки, систематизации и визуализации информации, Mind mapping и визуальное мышление.

Как уже говорилось выше, предметом этого курса является mind mapping – эффективная техника повышения персональной продуктивности. Но прежде чем обсуждать области применимости mind map "ов, правила их построения и типичные ошибки их использования, более того, прежде чем пытаться объяснить, что такое mind mapping вообще, нужно поговорить о визуальном (или радиантном) мышлении, воплощением и результатом которого являются mind map "ы.

Ассоциации как основа работы человеческого мозга

Вы когда-нибудь задумывались о том, на каких принципах основана работа тех сверхмощных компьютеров, которые каждый из нас носит внутри своего черепа? Готов держать пари – первая мысль, пришедшая в голову большинству читателей, была о микропроцессорах, лежащих в основе наших ноутбуков и рабочих станций. Однако смутные подозрения о несопоставимости "весовых категорий" кремниевого микрочипа и головного мозга все же не дают нам с уверенностью рассуждать о том, как все просто – двоичная арифметика, "есть импульс – нет импульса" и все такое. Да, как модель работы мозга двоичная машина вполне приемлема, но очень уж грубая это модель (мы же помним, что любая модель отражает только одно, наиболее важное в данном контексте свойство объекта, правда?). Как-то слишком примитивно получается – свести наше мышление к нулям и единичкам. А как же тогда объяснить тот каскад мелких воспоминаний – ощущений, цветов, запахов, идей, проносящихся перед нашим мысленным взором, когда мы о чем-то думаем? Многие из этих образов для большинства посторонних людей никак не связаны с предметом наших размышлений и значат что-то конкретное только для них, поскольку связаны с какими-то личными воспоминаниями и переживаниями. Позвольте себе подумать о чем-то и не придерживайтесь какого-то определенного направления мысли – вы будете удивлены тем, как быстро и далеко вы уйдете от первоначальной темы размышлений: сменяющиеся образы, связанные, как звенья одной цепи, вытаскивая друг друга из закромов памяти, быстро уведут вас от объекта, о котором вы подумали. Конечно, можно попытаться объяснить подобное поведение нашего мозга тем, что он просто отрабатывает гениально сложную разветвленную программу обработки информации с учетом данных, уже хранящихся в памяти, но все далеко не так просто.

Любая информация , поступающая в наш мозг (неважно, что это – прикосновение, вкус, запах, цвет, звук), вытаскивает за собой на свет Божий массу мелких воспоминаний, мыслей и ощущений, подобно тому, как от упавшего в пруд камня расходятся по поверхности воды концентрические круги. А каждое из этих воспоминаний тянет за собой массу других, которые, в свою очередь , вызывают к жизни все новые и новые образы, мысли или идеи. Да, я понимаю, что уже немного утомил читателя своими пространными рассуждениями. А суть их состояла в том, что единички и нолики, возможно хороши для того, чтобы объяснить, как работает наш мозг на "физическом уровне", но если речь идет о принципах его работы , то следует говорить не о битах, а об ассоциациях как минимальных единицах обработки информации человеческим мозгом . Помните понятие лексемы как минимальной единицы языка, имеющей самостоятельный смысл? Так вот, в том языке, на котором "говорит" наш мозг, такими лексемами являются ассоциации. Что же такое ассоциация ?

Ассоциация :

в физиологии – образование временной связи между индифферентными раздражителями в результате их многократного сочетания по времени;

в психологии – закономерная связь между отдельными событиями, фактами, предметами или явлениями, отраженными в сознании и закрепленными в памяти.

При наличии ассоциативной связи между психическими явлениями A и B возникновение в сознании человека явления A закономерным образом влечет появление в сознании явления B.

Итак, каждая ассоциация связана с огромным числом новых ассоциаций, которые, в свою очередь , связаны с новыми и новыми понятиями. Таким образом, мышление можно представить в виде сложного ассоциативного алгоритма, своего рода слалома по ветвям дерева ассоциаций, расходящимся от ствола – основной мысли. В свое время профессор Анохин (http://ru.wikipedia.org/wiki/Анохин,_Пётр_Кузьмич) говорил, что возможности мозга по формированию ассоциативных связей намного превосходят его возможности по хранению информации. Что же касается информационной емкости мозга, то она тоже весьма впечатляет – доктор Марк Розенцвейг (http://en.wikipedia.org/wiki/Mark_Rosenzweig) писал, что даже в том случае, если бы человек запоминал 10 единиц информации ( слово , изображение или другое элементарное впечатление) каждую секунду в течение 100 лет, заполнить удалось бы менее одной десятой суммарного объема человеческой памяти. И сколько бы таких единиц информации ни хранилось у нас в голове, количество ассоциаций, связанных с ними, еще на несколько порядков выше! Потенциал человеческого мозга, связанный с созданием ассоциаций, поистине безграничен: все наши идеи, воспоминания и ощущения хранятся у нас в голове в виде своеобразных "треков" – извилистых ветвящихся дорожек, связывающих их с другими нашими мыслями.

Вот пример того, что обычно творится у нас в голове:

Не правда ли, весьма знакомая картина?

Таким образом, в основе работы нашего мозга лежат два важнейших принципа.

Ассоциативное мышление – связь каждого воспоминания с массой других образов, и именно об этом принципе мы с вами говорили последние десять минут.
Иерархия понятий – в каждом таком ассоциативном "треке" один из образов является главным (корневым), от которого расходятся ветви-дорожки к другим понятиям, идеям, воспоминаниям. В результате мы получаем некое дерево (или граф) образов, связанных с исходным понятием.

Если же постараться объединить эти два принципа (которые работают в комплексе, дополняя друг друга), то следует сказать о так называемом радиантном , или визуальном , мышлении . О нем мы поговорим в этой же лекции, но чуть позже. А пока постараемся разобраться в том, какие же теории обработки, систематизации и визуализации информации существуют в данный момент, и не имеют ли они каких-то общих черт с описанными нами выше принципами работы человеческого мозга.

Понятие о теориях обработки, систематизации и визуализации информации

Cуществующие теории обработки информации

Начнем с определений.

Обработка информации – любое преобразование информации из одного вида в другой, производимое по строгим формальным правилам.

Теория обработки информации (information-processing theory) – направление научного знания, изучающее то, как люди обращаются с информацией, отбирают и усваивают ее, а затем используют в процессе принятия решений и управления своим поведением.

Теории обработки информации применяются при изучении восприятия, памяти, внимания, речи, мышления и решения задач экспериментальной психологии. В свою очередь, большой вклад в развитие упомянутых теорий внесли математическая логика, техника связи, теория информации и теория вычислительных систем. Почему же мы говорим "теории" – во множественном числе? Дело в том, что на самом деле следует говорить о целом семействе абсолютно разрозненных теоретических и исследовательских программ. Естественно, как и в любом научном сообществе, согласия между исследователями нет и в помине – мнения ученых сходятся лишь в некоторых исходных посылках, теории и методологии исследований. В рамках упомянутого семейства можно выделить такие широко известные в узких кругах подходы, как трансформационная лингвистика (http://ru.wikipedia.org/wiki/Генеративная_лингвистика), психология Пиаже (http://www.gumer.info/bibliotek_Buks/Psihol/Jaroschev/11.php) и радикальный бихевиоризм. Бихевиоризм, в частности, занимался изучением поведения животных и активно распространял свои принципы на все области психологии. Однако возникли некоторые трудности при попытке распространить теорию и методы бихевиоризма на символические процессы человека, в частности, на языковые способности. Когда разочарование ученых в привычных методах стало всеобщим, исследователи-психологи обратились к другим теориям, в результате чего о бихевиоризме почти забыли. Тем не менее, ученые, развивающие теории обработки информации, разделяют со своими предшественниками-бихевиористами веру в эмпиризм, операционализм и т.п. Да, психологи отказались от распространения на людей выводов, полученных вследствие экспериментов с животными, и от объяснения видимого поведения индивидов внешними причинами, в частности, влияниями окружающей среды. В то же время общая методология и статистические методы обработки результатов экспериментов остались прежними – просто животных в качестве испытуемых сменили люди. Ученая братия вновь признала существование врожденных способностей и начала активно обсуждать такие внутренние процессы, как планы, стратегии, образы, решения и ассоциации .

ХХ век ознаменовался бурным развитием технологий связи – телефонии, радио и телевидения. Очень показательной была продемонстрированная психологами аналогия между обработкой информации человеческим мозгом и работой описанного в теории связи информационного канала. Большую роль в создании математической теории информации и переносе понятий теории связи на работу человеческого мозга сыграли исследования Клода Шеннона (знакомое имя, не правда ли?). Созданная им теория описывает передачу сообщений любой природы от любого источника любому получателю, в том числе и передачу сигналов внутри человеческого мозга.

Но вспомним еще об одном непонятном названии, упомянутом нами в начале этого раздела, – трансформационной лингвистике. В свое время Ноам Хомский (http://ru.wikipedia.org/wiki/Хомский,_Ноам) утверждал, что человеческий язык невозможно научно объяснить с позиций бихевиоризма. Он настаивал на том, что этот подход абсолютно неправильно представляет природу языка, игнорируя его структуру, правила и грамматику. Взамен этого он говорил о "правилах в голове" человека, позволяющих преобразовать (трансформировать) передаваемую информацию – разбить ее на смысловые единицы (слова) и связать эти единицы между собой. Отойдя от бихевиоризма, новая парадигма обработки информации в поисках идей все больше склонялась к лингвистике. Вот и современные исследователи стремятся обнаружить психологические процессы или умственные операции, которые лежат в основе языковой активности. Активно изучаются такие виды когнитивной активности, как восприятие, память, мышление и понимание. И понятие ассоциации опять не осталось в стороне.

Что же касается теории вычислительных систем, то за этим названием также скрывается целый выводок абсолютно разношерстных дисциплин. Сюда входят теория алгоритмов, численные методы, теория конечных автоматов, языки программирования, теория искусственного интеллекта и многое другое… И это не единственная черта, которая роднит теорию вычислительных систем с психологией обработки информации, – оба направления выросли из математической логики, оба занимались изучением природы разумного поведения, а появление вычислительных машин и развитие принципов, на которых они строились, привело к возникновению еще одной аналогии человеческих психических и интеллектуальных способностей. Машинные модели помогли в изучении мышления и в особенности – процесса решения задач. Отталкиваясь от этой аналогии, психологи пытаются объяснить, каким образом мозг получает информацию, перекодирует и сохраняет ее в памяти, каким образом он затем использует ее для принятия решений и управления поведением. Конечно, полного соответствия между работой мозга и компьютера нет и быть не может, но все же ученым удалось создать стройную концепцию, способную объяснить, каким образом интеллектуальная система – будь это человек или некое устройство – создает новые знания. Догадайтесь, какое понятие играет тут важнейшую роль? Да, конечно, вы правы – это понятие ассоциации !

Систематизация и структурирование информации

Итак, с обработкой информации мы разобрались, перейдем теперь к систематизации. Конечно, мы не забываем о том, что систематизация информации – это составная часть алгоритма обработки информации, некий его этап, но все равно, об этом этапе нужно сказать отдельно. Как всегда, сначала обратимся к определению:

Систематизировать – распределить элементы информации по признакам родства, сходства, т. е. классифицировать и типизировать их.

Мозг человека (в контексте процессов восприятия, запоминания, преобразования информации и т.п.) работает именно с систематизированной информацией. Например, процесс запоминания проходит намного эффективнее, если человеку удается рационально структурировать получаемую информацию, разложить по полочкам, как говорят в народе. В коммуникативных процессах (помните, мы говорили о языке и лингвистике?) систематизированное представление передаваемой информации также играет важную роль. Систематизация и структурирование информации – важнейшие психологические механизмы, благодаря которым человеческий мозг может эффективно обрабатывать большие потоки информации.

Стремление к целостному охвату объекта изучения, к систематизации знаний свойственно любому процессу познания. Многие исследователи отмечали, что процесс работы мозга над проблемой идет от осознания свойств, характеристик и функций объекта изучения к поиску недостающих структурных элементов, связей и отношений между ними. А если овладеть системным подходом и развить свое умение систематизировать и структурировать информацию, можно помочь мозгу работать эффективнее в процессе учебы и при решении профессиональных задач.

Структуры данных бывают разные – линейные (список), табличные, иерархические (дерево). Деревья (графы) понятий, построенные на основе ассоциативных связей, – наиболее естественный для нашего мозга способ представления (структурирования) данных (хотя, строго говоря, не следует путать ассоциативные и классификационные отношения). Вспомним о визуальном мышлении? Кстати, раз уж мы заговорили о деревьях, то нам пора плавно перейти к рассмотрению вопроса о визуализации информации. Но прежде отметим, что существует целое направление научного знания, изучающее методы и приемы структурирования информации, которое называется информационной архитектурой . Классики говорят, что

информационная архитектура – как наука занимается принципами систематизации информации и навигации по ней с целью помочь людям более успешно находить и обрабатывать нужные им данные.

Первое, что приходит нам в голову при слове "визуализация", – это графики и диаграммы (вот она, сила ассоциаций!). С другой стороны, визуализировать таким образом можно только числовые данные, никому еще не удавалось построить график на основе связного текста. Для текста мы можем построить план, выделить основные мысли (тезисы) – сделать краткий конспект. О недостатках и вреде конспектирования мы поговорим чуть позже, а сейчас скажем о том, что если объединить план и краткий конспект – "развесить" тезисы по ветвям дерева, структура которого соответствует структуре (плану) текста, – то мы получим отличную структурную схему текста, которая запомнится намного лучше, чем любой конспект. В этом случае ветви будут играть роль тех "треков" – дорожек, связывающих понятия и тезисы, о которых мы говорили ранее.
Помните, как мы строили UML-диаграммы на основе описания проектируемой программной системы, полученного от ее будущих пользователей? Полученные картинки воспринимались и клиентами, и разработчиками намного проще и быстрее, чем текстовое описание. Точно так же можно "изобразить" абсолютно любой текст, не только техническое задание на разработку системы. Подход, описанный нами выше, позволяет визуально представить абсолютно любой текст – будь это сказка, техническое задание, лекция, фантастический роман или результаты совещания – в виде удобного и простого для восприятия дерева. Строить его можно как угодно – лишь бы получилась наглядная и понятная схема, которую хорошо бы еще проиллюстрировать подходящими по смыслу рисунками.
Такие схемы удобно применять и в общении при обсуждении каких-либо вопросов и проблем. Как показывает практика, отсутствие четких стандартов нотации не создает абсолютно никаких коммуникативных сложностей для участников обсуждений. Наоборот, использование невербальных форм представления информации позволяет концентрировать внимание именно на ключевых точках проблемы. Таким образом, визуализация является одним из наиболее перспективных направлений повышения эффективности анализа, представления, восприятия и понимания информации.
Ух, наконец-то мы покончили с нудным описанием научных теорий, методов и приемов, применяющихся для обработки, систематизации и визуализации информации! Предыдущая часть главы сильно утомила и автора, и читателей, и тем не менее, она была необходима: в результате мы увидели, что особенности работы нашего мозга уже активно применяются учеными в самых разных областях науки, многие вещи, которые кажутся нам привычными, – персональные компьютеры, пользовательские интерфейсы, базы знаний и т.д. – изначально строились с учетом ассоциативного характера человеческого мышления и его склонности к иерархическому представлению и визуализации информации. Но вершиной и естественным графическим выражением мыслительных процессов человека является mind mapping, к обсуждению которого мы наконец-то переходим. А заодно попытаемся расширить наше понимание принципов визуального мышления.

Самым простым способом анализа получаемой информации является ее структурирование. Структурирование есть не что иное, как расположение в определенном порядке, или по определенной схеме. Такой порядок может быть определен по-разному. Наиболее яркий пример - расположение информации в хронологическом порядке. Например, информацию из разных источников о неком событии располагают последовательно от более раннего к более позднему (или наоборот), т.е. в соответствии со временем, которое описывается данным блоком информации. Другой способ структурирования информации - расположение каждого блока информации в разных разделах в зависимости от того элемента, который описывает данный информационный блок. Далее предлагаю более подробно ознакомиться с разными способами структурирования информации. Отличаются они в основном тем, по какому принципу происходит структурирование.

Расположение в хронологическом порядке, или построение последовательности событий
Данный метод еще называют историческим. Все поступающие данные выстраиваются по времени описываемых событий.

После чего определяется:
- что за чем следует,
- какой факт какое событие предопределяет,
- что чему сопутствует и т.п.

Иначе говоря, восстанавливается хронология событий. Это один из наиболее простых способов и в то же время достаточно эффективных.

Самый простой пример использования исторического метода (хронологии) - это изучение кандидата при его приеме на работу. У вас есть ряд источников: кандидата, его трудовая книжка, заполненная им анкета. Кроме того, вы можете использовать Интернет для выявления его мест работы (по оставленным им же объявлениям и заявкам) или базы данных. Собрав всю эту информацию, вы составляете несколько последовательностей (хронологий):
1) как кандидат хочет выглядеть (по его резюме и анкете);
2) как было на самом деле (по его трудовой книжке);
3) вспомогательный вариант (по всем остальным источникам).

Еще один вариант использования хронологии - это построение цепочки событий. При этом особенно ценно, если аналогично рассматриваются и параллельные происшествия или события рассматриваются с учетом известного происшествия, тогда многое становиться понятно. Привязку событий к определенному происшествию используют для выявления поведенческих реакций объекта, правда, это уже моделирование, но для регистрации и анализа используется все тот же исторический метод (хронология событий). В определенной среде это называется провоцированием. Например, объекту дают некую «горящую» информацию - информацию, требующую немедленных действий (присылают по почте, передают как слух, сообщают официально и т.п.), а затем внимательно наблюдают:
- что и в какой последовательности он предпримет;
- к кому обратится в первую очередь;
- как в принципе отреагирует на сообщение и т.д.

Можно данное мероприятие обставить соответствующим образом. Например, ограничить объект в перемещении или в связи, создать впечатление, что у него практически нет времени на обдумывание и т.п. Все зависит от того, что вы хотите понять (выявить). Для упрощения ситуации результат можно изобразить схематически. Если несколько последовательностей изобразить в одном масштабе и одним стилем, то при их совмещении можно выявлять закономерности, корреляцию и т.п.