Разница между знанием и информацией. Отличия данных от знаний

Данные

Информация

Операции с данными

В ходе информационного процесса данные преобразуются из одного вида в другой. По мере развития НТП и общего усложнения связей в человеческом обществе трудозатраты на обработку данных неуклонно возрастают (постоянное усложнение условий управления производством и обществом + быстрые темпы появления и внедрения новых носителей/хранителей данных – увеличение объёма данных).

1. Сбор – накопление данных с целью обеспечения достаточной полноты информации для принятия решения;

2. Формализация – приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить их уровень доступности;

3. Фильтрация – отсеивание «лишних» данных, в которых нет необходимости для принятия решений; при этом должен уменьшаться уровень «шума», а достоверность и адекватность данных должны возрастать;

4. Сортировка – упорядочение данных по заданному признаку с целью удобства использования; повышает доступность информации;

5. Группировка – объединение данных по заданному признаку с целью повышения удобства использования; повышает доступность информации;

6. Архивация – организация хранения данных в удобной и легкодоступной форме; служит для снижения экономических затрат на хранение данных и повышает общую надежность информационного процесса в целом;

7. Защита – комплекс мер, направленных на предотвращение утраты, воспроизведение и модификации данных;

8. Транспортировка – прием и передача (доставка и поставка) данных между удаленными участниками информационного процесса; при этом источник данных в информатике принято называть сервером, а потребителя – клиентом;

9. Преобразование – перевод данных из одной формы в другую или из одной структуры в другую. Пример: изменение типа носителя; книги – бумага, электронная форма, микрофотоплёнка. Необходимость в многократном преобразовании данных возникает также при их транспортировке, особенно если она осуществляется средствами, не предназначенными для транспортировки данного вида данных.

2. Связь понятий «информация, данные, знания». Модель dikw

Универсальных опеределений нет.

Зна́ние - в теории искусственного интеллекта и экспертных систем - совокупность информации и правил вывода (у индивидуума, общества или системы ИИ) о мире, свойствах объектов, закономерностях процессов и явлений, а также правилах использования их для принятия решений. Главное отличие знаний от данных состоит в их структурности и активности, появление в базе новых фактов или установление новых связей может стать источником изменений в принятии решений.

Данные - это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.

Информация - это результат преобразования и анализа данных. Отличие информации от данных состоит в том, что данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач. Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

Для решения задачи данные обрабатываются на основании имеющихся знаний, информация анализируется с помощью знаний. На основе анализа предлагаются варианты решения, принимвается лучшее, пополняет знания.

Принятия решений осуществляются на основе полученной информации и имеющихся знаний. Принятие решений – это выбор наилучшего в некотором смысле варианта решения из множества допустимых на основании имеющейся информации.

DIKW (англ. data, information, knowledge, wisdom - данные, информация, знания, мудрость) - информационная иерархия, где каждый уровень добавляет определённые свойства к предыдущему уровню.

Сама модель ведет свои истоки от работ философа Мортимера Адлера, однако впервые в приложении к теории управления знаниями она была формализована Николя Анри. В качестве дополнения в 1989 г. Расселом Акоффом было предложено расширение этой модели слоем «understanding» (понимание): понимание требует анализа и предопределения, благодаря чему оно помещено между знанием и мудростью. Относительно временного распределения слоев он указывает на краткость жизненного цикла информации по сравнению с жизненным циклом знания; понимание считается непостоянным, а мудрость принимается за константу

В основании находится уровень данных.

Информация добавляет контекст.

Знание добавляет «как» (механизм использования)

Мудрость добавляет «когда» (условия использования)


Модуль 1 (1,5 кредит): Введение в экономическую информатику

Тема 1.1: Теоретические основы экономической информатики

Тема 1.2: Технические средства обработки информации

Тема 1.3: Системное программное обеспечение

Тема 1.4: Сервисное программное обеспечение и основы алгоритмизации

Экономическая информатика и информация

1.1. Теоретические основы экономической информатики

1.1.2. Данные, информация и знания

Основные понятия данных, информации, знаний.

К базовым понятиям, которые используются в экономической информатике, относятся: данные, информация и знания. Эти понятия часто используются как синонимы, однако между этими понятиями существуют принципиальные различия.

Термин данные происходит от слова data - факт, а информация (informatio) означает разъяснение, изложение, т.е. сведения или сообщение.

Данные - это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.

Информация - это результат преобразования и анализа данных. Отличие информации от данных состоит в том, что данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач. Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

Существуют и другие определения информации, например, информация – это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний.

Знания – это зафиксированная и проверенная практикой обработанная информация, которая использовалась и может многократно использоваться для принятия решений.

Знания – это вид информации, которая хранится в базе знаний и отображает знания специалиста в конкретной предметной области. Знания – это интеллектуальный капитал.

Формальные знания могут быть в виде документов (стандартов, нормативов), регламентирующих принятие решений или учебников, инструкций с описанием решения задач.

Неформальные знания – это знания и опыт специалистов в определенной предметной области.

Необходимо отметить, что универсальных определений этих понятий (данных, информации, знаний) нет, они трактуются по-разному.

Принятия решений осуществляются на основе полученной информации и имеющихся знаний.

Принятие решений – это выбор наилучшего в некотором смысле варианта решения из множества допустимых на основании имеющейся информации.

Взаимосвязь данных, информации и знаний в процессе принятия решений представлена на рисунке.


Рис. 1.

Для решения поставленной задачи фиксированные данные обрабатываются на основании имеющихся знаний, далее полученная информация анализируется с помощью имеющихся знаний. На основании анализа, предлагаются все допустимые решения, а в результате выбора принимается одно наилучшее в некотором смысле решение. Результаты решения пополняют знания.

В зависимости от сферы использования информация может быть различной: научной, технической, управляющей, экономической и т.д. Для экономической информатики интерес представляет экономическая информация.

1. В чем отличие знаний от данных.

Информация (данные) явл-ся неотъемлемой частью материального мира, характериз-его его упорядоченность или структуру в мире, обусловлена их способностью распознавать стр-ру окружающего мира и использовать рез-т распознавания (знаний о мире). Знания – это информация, воспринятая из внешнего мира. Знание субъективно. Знание уникально, и обмен знаниями м/у индивидами не происходит без потерь, в отличие от данных, в кот. закодирована информация и кот. м. передаваться без потерь. Знание передается посредством к-л метода представления знаний, типичным естественным языком.

Отличаются:

Знания более структурированы;

В знаниях наибольшее зн-ие имеют не атомарные эл-ты знаний, а взаимосвязи м/у ними;

Знания более самоинтерпритируемые, чем данные, т.е. в знаниях содержится информация о том, как их использовать;

Знания активны, в отличие от пассивных данных, т.е. м. порождать действия системы, использующей их.

2. Каковы два основных направления исследований в ИИ

1. Нейронные сети.

Идея. «Единственный объект, способный мыслить – это человеческий мир»; 10 21 нейронов в мозгу, кот. связаны м/у собой. Розенблед, Мак-Каллок – 1936 – 1965 модель percepton

Модель перцетона:

каж. точка предыдущего слоя связана со всеми точками данного слоя

1 слой 2 слой

Распределенная ВС. Индексирование БД. Это синтаксические системы, основанные на формальном подходе. (Модель нервных цепей).

2. Семантические модели.

Идея. Противоположная нейронной идеологии: «не имеет зн-ия, как устроено вычислительное устройство, главное чтобы на заданные входные действия оно реагировало как чел. мозг » - концепция «черного ящика».

Тезис Тьюринга, кот. определил семантический подход (ф-ии мозга).

Языки: Lisp, Fortran.

3. Приведите примеры нечетких знаний.

а)

Молодой б) Пусть S – множество людей. Пусть «высокий» - нечетное подмножество S, кот. ответит на вопрос: «какой человек X явл-ся высоким?». Каж. человеку из области наследования нужно назначить степень принадлежности к нечетному подмножеству «высокий». Для этого используем ф-ию принадлежности, основанную на росте человека:

0, если рост(х)<5 футов;

Высокий(х)= (рост(х) – 5ft)/2ft, если 5 футов<= рост(х) <=7 футов;

1, если рост(х) > 7 футов.

Графически:

4. Приведите пример, характеризующий поверхностные и глубинные знания.

Поверхностные знания:

Я знаю, что на авиазаводе в цехе собирают самолеты;

Y = a 0 x 0 + a 1 (x 0 *2) + a 2 (x 0 *3) + . . .

Глубинные знания:

Я знаю как, с помощью чего собирается самолет;


5. В чем отличие процедурных знаний от декларированных? Приведите примеры.

Процедурные знания – хранят информацию о том, как надо действовать, чтобы получить нужный результат. Декларированные знания – хранят в себе информацию о том, над чем надо выполнить эти действия.

Чтобы собрать самолет необходимо скрепить его основные части (проц. знания), для его сбора необходимы крылья, носовая часть, хвостовая и т.п. и их нужно соединить (декларир. знания).

Различие между декларативным и процедурным предпочтением в том, что последнее определяет не только логические связи между головой предложения и целями в его теле, но еще и порядок в котором эти цели обрабатываются.

6. Охарактеризуйте морфологический, синтаксический, семантический и прагматический анализы в естественных языковых интерфейсах.

a) Морфологический анализ – анализ слова в предложении.

b) Семантический анализ – распознавание смысла в составных частях предложения на основе некоторой предметно - ориентированной БЗ.

c) Синтаксический анализ – анализ распознавания структуры предложения.

d) Прагматический анализ – анализ смысла предложения в реальном контексте на основе собственной БЗ.

7. В чем разница интенсионала и экстенсионала. Пример.

Интенсионал – способствует связи с выделением закономерностей.

Экстенсионал – способ перечисления фактографических сторон (описание на уровне данных)

Пр. : объект (философия): 1. Высокий уровень

2. Примитивный

8. Построить фрейм для следующего примера: “Пингвин и синица- птицы, однако пингвин не умеет летать, о умеет плавать и живет в Антарктиде”.


Знания в современных компаниях

Компания "Ксерокс" в последние годы позиционирует себя не как производитель копировальных аппаратов, а как компания по обработке документов. Компания "ЗМ" называет себя компаний по инновационному решению задач. "ИБМ" идентифицирует себя как компания, создающая долгосрочные экономические преимущества для клиентов, объединяя свои знания в области бизнеса с широкими технологическими возможностями. Компания Steelcase, которая производит конторское оборудование, утверждает, что она продает собственные знания и услуги, которые позволяют создать лучшие условия пребывания людей на своих рабочих местах. Что добавляет стоимость в деятельность всех этих компаний? Это в основном решения, базирующиеся на знаниях: технические и технологические ноу-хау, дизайн продукта, маркетинговые исследования, выявление истинных нужд клиентов. Именно знания дают устойчивое конкурентное преимущество этим компаниям.

Рассмотрим, в чем отличие знаний от данных и информации. То, что это разные вещи, руководители начинают осознавать особенно ярко после того, как в организации потрачены значительные средства для создания той или иной базы данных, или информационной системы, или же просто эти средства потрачены на компьютеризацию, причем без соответствующего эффекта.

Данные - это совокупность различных объективных фактов. В корпорациях это, например, структурированные записи о трансакциях (в частности, данные обо всех продажах: сколько, когда и кто купил, сколько и когда заплатил и пр.). Эти данные не говорят о том, почему покупатель пришел именно сюда и придет ли он еще раз.

Информация - это иерархическая совокупность данных о тех или иных аспектах реального мира. Информация - это поток сообщений, а знание создается из этого потока, оно находится в зависимости от мнений и убеждений носителя знания.

Информация - это своего рода послание, обычно в форме документа или в видео- либо в аудиоформе. Она имеет получателя и отправителя. Она информирует, т.е. "придает форму", получателю путем изменения его оценок или поведения. Насколько послание является информацией, определяет получатель. Именно он оценивает, насколько полученное сообщение информирует его, а насколько оно представляет собой просто информационный шум.

Данные превращаются в информацию несколькими путями:

  • o контекстуализация : мы знаем, для чего эти данные нужны;
  • o категоризация : мы разбиваем данные на типы и компоненты;
  • o подсчет : мы обрабатываем данные математически;
  • o коррекция : мы исправляем ошибки и ликвидируем пропуски;
  • o сжатие : мы сжимаем, концентрируем, агрегируем данные.

Знания - понятие более глубокое и широкое, чем просто данные или информация. Каждое предприятие в ходе своей деятельности осуществляет сбор данных, их структуризацию и генерирование нового знания. Чаще всего это знание касается технологии, если речь идет о материальном производстве, а также технологии работы с клиентами и технологии взаимодействия друг с другом, если речь идет о предприятии, осуществляющем обслуживание клиентов. Также это может быть знание относительно окружающей среды предприятия - о демографических, макроэкономических, социальных, макроэкономических, технологических и конъюнктурных трендах.

Отличие знаний от информации и данных: пример

У компании Chrysler имеется собрание компьютерных файлов, которые носят название "Книга инженерных знаний" и представляют собой исчерпывающие данные и информацию о создании автомобилей этой компании, которыми может пользоваться каждый разработчик новых автомобилей. Когда управляющий получил данные о проведенных крэш-тестах, то он отказался их поместить в файлы без соответствующей обработки. Он предложил ответить на следующие вопросы:

  • o почему эти тесты проводились;
  • o каковы результаты по сравнению другими аналогичными тестами данной компании других лет и конкурентов;
  • o какие выводы дачи тесты для конструкции автомобиля и его основных узлов?

Аналогичные вопросы трансформируют информацию в знания; более того, ответы на эти вопросы добавляют информации ценность, или, говоря другими словами, добавляют стоимость. На практике встречаются противоположные примеры, когда путем добавления ненужной, пустой информации исходная информация теряет в своей цене. Происходит потеря стоимости за счет размывания нужной информации в потоке информационного шума.

Знание - это комбинация опыта, ценностей, контекстной информации, экспертных оценок, которая дает общие рамки для оценки и инкорпорирования нового опыта и информации. Знание существует в сознании тех, кто знает. В организациях оно фиксируется не только в документах, но и в процессах, процедурах, нормах, в целом в практике деятельности.

Точно так же как информация возникает из данных, так и знания возникают из информации путем:

  • o сравнения, определения области применения (как и когда мы можем применить информацию об этом явлении к другому, аналогичному);
  • o установления связей (как эта информация соотносится с другой информацией);
  • o оценки (как можно оценить данную информацию и как ее оценивают другие);
  • o определения области применения (какое применение имеет эта информация к тем или иным решениям или действиям).

Процесс трансформации данных в информацию, а информации в знания показан на рис. 14.1.

Рис. 14.1.

Различают индивидуальные и групповые знания. Традиционные представления исходят из того, что знания - это прерогатива отдельных людей, при этом группа - это лишь простая сумма членов этой группы, а групповое знание - сумма их знаний.

Существует другая, современная точка зрения, в соответствии с которой группа людей формирует новую сущность со своей уникальной спецификой. В рамках этого представления можно говорить о групповом поведении и о групповом знании соответственно. Это новое представление широко используется в рамках науки об управлении знаниями. Таким образом, знание может быть не только у отдельного человека, но и у группы людей. Тогда говорят о том, что что-то знает организация в целом, что-то знает группа, бригада и т.д.

Билл Гейтс в своей книге "Бизнес со скоростью мысли" пишет о необходимости повышения корпоративного IQ. При этом он имеет в виду не только количество умных сотрудников, но и накопление знаний в компании в целом и свободное распространение информации, которое позволяет сотрудникам пользоваться идеями друг друга.

Знание может быть явным и неявным. Явное знание может быть выражено в виде слов и цифр и может передаваться в формализованном виде на носителях. Это относится к тем видам знаний, которые передаются в форме предписаний, инструкций, книг, на различных носителях, в виде памятных записок и пр.

Неявное знание в принципе не формализуется и может существовать лишь вместе с его обладателем - человеком или группой лиц.

Существует два вида неявного знания. Первое - это технические навыки, которые проявляются у мастеров своего дела и выступают, как правило, результатом многолетней практики. Второе - это верования, идеалы, ценности и ментальные модели, которые мы используем, не задумываясь о них.

Неявные знания формируются и развиваются в процессе создания и укрепления позитивной корпоративной культуры и с помощью средств группового взаимодействия (ретриты, творческие группы и пр.).

Отношение к явному и неявному знанию со стороны коммерческих фирм весьма противоречиво. С одной стороны, многие фирмы стремятся перевести неявное знание в явное. Это делается для того, чтобы, с одной стороны, не зависеть от отдельных личностей, а с другой - продублировать значимые достижения. В то же время эти фирмы не заинтересованы в том, чтобы основные конкурентные преимущества перешли в форму, готовую для дублирования. Именно поэтому многие компании стараются сохранять некоторые из своих конкурентных преимуществ в тех формах, которые не поддаются дублированию (специфические тренинги, корпоративная культура, специальные системы обслуживания и пр.).

Носителем как явного, так и неявного знания может быть не только конкретная личность, но и организация . Следовательно, можно говорить и о неявном групповом знании, которое лежит в основе устойчивых моделей коллективных реакций и внутренних взаимодействий.

В западной литературе для обозначения неявного группового знания иногда используется термин "рутины" (routines), которые есть повторяющиеся по шаблону действия, регулярные поведенческие шаблоны организации или фирмы. Рутины - это то, что происходит автоматически, без инструкций и в отсутствие процедуры выбора; при этом рутины не могут быть кодифицированы.

В русском языке под рутиной понимаются заведенный порядок, установившаяся практика, определенный режим, шаблон, сложившиеся правила, касающиеся занятий людей. В то же время понятие "рутина" имеет еще один опенок: это косный порядок, т.е. такой порядок, который тяготеет к старому, привычному, в силу своей отсталости невосприимчивый к новому, прогрессивному. В тех случаях, когда термин "рутина" применяется для обозначения группового неявного знания, то оттенки, относящиеся к косности, отсутствуют.

Таким образом, персональное неявное знание - это, прежде всего, умения. В то же время групповое неявное знание - это, прежде всего, рутины. Рутины существуют не изолированно, а образуя взаимозависимость. Некоторые рутины могут быть неявными для одних членов группы (организации) и явными для других. Таким образом, границы между явными и неявными знаниями относительны, также можно говорить о степени неявности этих знаний. Соотношение явных и неявных, индивидуальных и групповых знаний представлено в табл. 14.1.

Таблица 14.1

Соотношение знаний

Наличие неявных знаний в организации заставляет подходить к управлению знаниями нетрадиционным способом. Традиционно под управлением знаниями понимают создание, развитие и использование различных баз данных и знаний. Наличие неявных знаний смещает внимание к средствам прямого общения между людьми. Важно не только и не столько создать корпоративную энциклопедию, в которой записано все, что кто-либо из работников знал и с чем сталкивался. В случае с неявными знаниями важнее иметь под рукой координаты людей, которые знают рецепт и имеют соответствующий опыт, создать культуру общения, используя "мозговые штурмы", совещания, "разборы полетов" и соответствующие средства общения, такие как электронная почта, персональные сайты, телеконференции и пр.

Глава 1 Основные понятия

В этой книге описываются методы обработки информации, представленной в различной форме - в виде «данных», «знаний», «структур» и т. д. В основе анализа всех этих видов информации лежат две процедуры: процедура обнаружения закономерностей, содержащихся в представленной информации, и процедура использования обнаруженных закономерностей для предсказания значения одной части информации по известным значениям другой ее части. Но прежде чем переходить к описанию этих процедур, нужно пояснить смысл употребляемых в книге терминов, в частности таких распространенных, как данные, знания, гипотеза, закономерность и т. п.

§ 1. Чем отличаются «данные» от «знаний»?

Исходная информация, которую нужно обрабатывать, чаще всего имеет вид числовых таблиц (матриц), состоящих из строк и столбцов. Строки отражают информацию об изучаемых объектах или явлениях, а столбцы отражают свойства (признаки, характеристики) этих объектов или явлений. Природа объектов может быть любой - это могут быть физические тела, живые организмы, сигналы, отдельные социальные процессы, заводы, виды спорта, месторождения и т. д. Понятно, что набор признаков, описывающих эти объекты, будет в каждом случае своим и должен отражать их наиболее важные свойства.

На пересечении -й строки и -го столбца указывается значение -го признака у -го объекта. Такой факт (например, что -й дом имеет высоту 12 м) считаем атомарной частью данных о конкретном -м объекте. Полные данные об -м объекте содержатся в совокупности всех элементов -й строки. Информация же о всех заданных свойствах всех изучаемых объектов, записанная в таблице «объект-свойство», и называется таблицей данных. Таким образом, данные представляют собой совокупность отдельных конкретных фактов.

Пусть в таблице данных представлены описания большого количества жилых домов, а нас интересуют только три свойства этих домов: из какого материала они построены, в какой цвет покрашены их стены и какой они высоты. После изучения таблицы данных мы можем обнаружить некоторые закономерности. Например, выясняется, что все панельные дома, окрашенные в серый цвет, имеют высоту от 15 до 25 м, панельные зеленые дома - от 8 до 16 м, а кирпичные, вне зависимости от цвета стен, имеют высоту меньше 10 м. Обозначим признак «вид строительного материала» через . Этот признак принимает два понятных значения: (панель) или (кирпич). Признак «цвет стен», обозначаемый через принимает значения: = серый, = зеленый или = любой. Признак «высота» может принимать любое числовое значение от нуля до 30 м. Тогда обнаруженные закономерности можно сжато записать в виде таких логических высказываний:

Эти высказывания не содержат информации в виде конкретных характеристик каждого отдельного дома, но зато отражают наши знания о некоторых обобщенных характеристиках всех домов, описанных в таблице данных.

Так выглядит переход от данных к знаниям. Знания представляют собой краткое обобщенное описание основного содержания информации, представленной в данных. Знания могут быть представлены в различной форме. В дальнейшем мы будем пользоваться приведенной выше формой в виде логических правил типа «если... то...».