Отличия данных от знаний. Как получать знания. чем знания отличаются от данных и информации

Часто данные и информация отождествляются, однако между двумя терминами есть существенное различие:

Информация - знания, касающиеся понятий и объектов (факты, события, вещи, процессы, идеи) в человеческом мозге;

Данные - представление переработанной информации, пригодной для передачи, толкования, или обработки (компьютерные файлы, бумажные документы, записи в информационной системе).

Отличие информации от данных состоит в том, что:

1) данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач.

Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

2)данные - это носители информации, а не сама информация.

3)Данные превращаются в информацию только тогда, когда ими заинтересуется человек. Человек извлекает информацию из данных, оценивает, анализирует ее и по результатам анализа принимает то или иное решение.

Данные превращаются в информацию несколькими путями:

Контекстуализация: мы знаем, для чего эти данные нужны;

Подсчет: мы обрабатываем данные математически;

Коррекция: мы исправляем ошибки и ликвидируем пропуски;

Сжатие: мы сжимаем, концентрируем, агрегируем данные.

Таким образом, если существует возможность использовать данные для уменьшения неопределенности знаний о каком-либо предмете, то данные превращаются в информацию. Поэтому можно утверждать, что информацией являются используемые данные.

4)Информацию можно измерять. Мера измерения содержательности информации связана с изменением степени неосведомленности получателя и основана на методах теории информации.

2. Предметная область - это часть реального мира, данные о которой мы хотим отразить в базе данных. Предметная область бесконечна и содержит как существенно важные понятия и данные, так и малозначащие или вообще не значащие данные. Таким образом, важность данных зависит от выбора предметной области.

Модель предметной области . Модель предметной области - это наши знания о предметной области. Знания могут быть как в виде неформальных знаний в мозгу эксперта, так и выражены формально при помощи каких-либо средств. Опыт показывает, что текстовый способ представления модели предметной области крайне неэффективен. Гораздо более информативными и полезными при разработке баз данных являются описания предметной области, выполненные при помощи специализированных графических нотаций. Имеется большое количество методик описания предметной области. Из наиболее известных можно назвать методику структурного анализа SADT и основанную на нем IDEF0, диаграммы потоков данных Гейна-Сарсона, методику объектно-ориентированного анализа UML, и др. Модель предметной области описывает скорее процессы, происходящие в предметной области и данные, используемые этими процессами. От того, насколько правильно смоделирована предметная область, зависит успех дальнейшей разработки приложений.

3. Ба́за да́нных - представленная в объективной форме совокупность самостоятельных материалов (статей, расчётов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ).

Многие специалисты указывают на распространённую ошибку, состоящую в некорректном использовании термина «база данных» вместо термина «система управления базами данных», и указывают на необходимость различения этих понятий.

1. В чем отличие знаний от данных.

Информация (данные) явл-ся неотъемлемой частью материального мира, характериз-его его упорядоченность или структуру в мире, обусловлена их способностью распознавать стр-ру окружающего мира и использовать рез-т распознавания (знаний о мире). Знания – это информация, воспринятая из внешнего мира. Знание субъективно. Знание уникально, и обмен знаниями м/у индивидами не происходит без потерь, в отличие от данных, в кот. закодирована информация и кот. м. передаваться без потерь. Знание передается посредством к-л метода представления знаний, типичным естественным языком.

Отличаются:

Знания более структурированы;

В знаниях наибольшее зн-ие имеют не атомарные эл-ты знаний, а взаимосвязи м/у ними;

Знания более самоинтерпритируемые, чем данные, т.е. в знаниях содержится информация о том, как их использовать;

Знания активны, в отличие от пассивных данных, т.е. м. порождать действия системы, использующей их.

2. Каковы два основных направления исследований в ИИ

1. Нейронные сети.

Идея. «Единственный объект, способный мыслить – это человеческий мир»; 10 21 нейронов в мозгу, кот. связаны м/у собой. Розенблед, Мак-Каллок – 1936 – 1965 модель percepton

Модель перцетона:

каж. точка предыдущего слоя связана со всеми точками данного слоя

1 слой 2 слой

Распределенная ВС. Индексирование БД. Это синтаксические системы, основанные на формальном подходе. (Модель нервных цепей).

2. Семантические модели.

Идея. Противоположная нейронной идеологии: «не имеет зн-ия, как устроено вычислительное устройство, главное чтобы на заданные входные действия оно реагировало как чел. мозг » - концепция «черного ящика».

Тезис Тьюринга, кот. определил семантический подход (ф-ии мозга).

Языки: Lisp, Fortran.

3. Приведите примеры нечетких знаний.

а)

Молодой б) Пусть S – множество людей. Пусть «высокий» - нечетное подмножество S, кот. ответит на вопрос: «какой человек X явл-ся высоким?». Каж. человеку из области наследования нужно назначить степень принадлежности к нечетному подмножеству «высокий». Для этого используем ф-ию принадлежности, основанную на росте человека:

0, если рост(х)<5 футов;

Высокий(х)= (рост(х) – 5ft)/2ft, если 5 футов<= рост(х) <=7 футов;

1, если рост(х) > 7 футов.

Графически:

4. Приведите пример, характеризующий поверхностные и глубинные знания.

Поверхностные знания:

Я знаю, что на авиазаводе в цехе собирают самолеты;

Y = a 0 x 0 + a 1 (x 0 *2) + a 2 (x 0 *3) + . . .

Глубинные знания:

Я знаю как, с помощью чего собирается самолет;


5. В чем отличие процедурных знаний от декларированных? Приведите примеры.

Процедурные знания – хранят информацию о том, как надо действовать, чтобы получить нужный результат. Декларированные знания – хранят в себе информацию о том, над чем надо выполнить эти действия.

Чтобы собрать самолет необходимо скрепить его основные части (проц. знания), для его сбора необходимы крылья, носовая часть, хвостовая и т.п. и их нужно соединить (декларир. знания).

Различие между декларативным и процедурным предпочтением в том, что последнее определяет не только логические связи между головой предложения и целями в его теле, но еще и порядок в котором эти цели обрабатываются.

6. Охарактеризуйте морфологический, синтаксический, семантический и прагматический анализы в естественных языковых интерфейсах.

a) Морфологический анализ – анализ слова в предложении.

b) Семантический анализ – распознавание смысла в составных частях предложения на основе некоторой предметно - ориентированной БЗ.

c) Синтаксический анализ – анализ распознавания структуры предложения.

d) Прагматический анализ – анализ смысла предложения в реальном контексте на основе собственной БЗ.

7. В чем разница интенсионала и экстенсионала. Пример.

Интенсионал – способствует связи с выделением закономерностей.

Экстенсионал – способ перечисления фактографических сторон (описание на уровне данных)

Пр. : объект (философия): 1. Высокий уровень

2. Примитивный

8. Построить фрейм для следующего примера: “Пингвин и синица- птицы, однако пингвин не умеет летать, о умеет плавать и живет в Антарктиде”.


Презентация без названия

Ба́за да́нных определение

Представленная в объективной форме совокупность самостоятельных материалов (статей, расчётов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ).

База данных - совокупность данных, хранимых в соответствии со схемой данных, манипулирование которыми выполняют в соответствии с правилами средств моделирования данных.

База данных - совокупность данных, организованных в соответствии с концептуальной структурой, описывающей характеристики этих данных и взаимоотношения между ними, причём такое собрание данных, которое поддерживает одну или более областей применения.

База данных - организованная в соответствии с определёнными правилами и поддерживаемая в памяти компьютера совокупность данных, характеризующая актуальное состояние некоторой предметной области и используемая для удовлетворения информационных потребностей пользователей.

База данных - некоторый набор перманентных (постоянно хранимых) данных, используемых прикладными программными системами какого-либо предприятия.

База данных - совместно используемый набор логически связанных данных (и описание этих данных), предназначенный для удовлетворения информационных потребностей организации.

База знаний

База знаний (БЗ; англ. knowledge base, KB) в информатике и исследованиях искусственного интеллекта - это особого рода база данных, разработанная для оперирования знаниями (метаданными). База знаний содержит структурированную информацию, покрывающую некоторую область знаний, для использования кибернетическим устройством (или человеком) с конкретной целью. Современные базы знаний работают совместно с системами поиска информации, имеют классификационную структуру и формат представления знаний.

Полноценные базы знаний содержат в себе не только фактическую информацию, но и правила вывода, допускающие автоматические умозаключения о вновь вводимых фактах и, как следствие, осмысленную обработку информации. Область наук об искусственном интеллекте, изучающая базы знаний и методы работы со знаниями, называется инженерией знаний.

Иерархический способ представления в базе знаний набора понятий и их отношений называется онтологией. Онтологию некоторой области знаний вместе со сведениями о свойствах конкретных объектов также можно назвать базой знаний.

Отличия

База знаний - семантическая модель, описывающая предметную область и позволяющая отвечать на такие вопросы из этой предметной области, ответы на которые в явном виде не присутствуют в базе. База знаний является основным компонентом интеллектуальных и экспертных систем.

База данных - совокупность связанных данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования, независимая от прикладных программ. База данных является информационной моделью предметной области. Обращение к базам данных осуществляется с помощью системы управления базами данных (СУБД)

Основные свойства

Основные определения. Информация, с которой имеют дело ЭВМ, разделяется на процедурную и декларативную. Процедурная информация овеществлена в программах, которые выполняются в процессе решения задач, декларативная информация - в данных, с которыми эти программы работают. Стандартной формой представления информации в ЭВМ является машинное слово, состоящее из определенного для данного типа ЭВМ числа двоичных разрядов - битов. Машинное слово для представления данных и машинное слово для представления команд, образующих программу, могут иметь одинаковое или разное число разрядов. Одинаковое число разрядов в машинных словах для команд и данных позволяет рассматривать их в ЭВМ в качестве одинаковых информационных единиц и выполнять операции над командами, как над данными. Содержимое памяти образует информационную базу. Машинное слово является основной характеристикой информационной базы, т.к. его длина такова, что каждое машинное слово хранится в одной стандартной ячейке памяти, снабженной индивидуальным именем - адресом ячейки. По этому имени происходит извлечение информационных единиц из памяти ЭВМ и записи их в нее. В языках программирования высокого уровня используются абстрактные типы данных, структура которых задается программистом. Появление баз данных (БД) знаменовало собой еще один шаг на пути организации работы с декларативной информацией. В базах данных могут одновременно храниться большие объемы информации, а специальные средства, образующие систему управления базами данных (СУБД), позволяют эффективно манипулировать с данными, при необходимости извлекать их из базы данных и записывать их в нужном порядке в базу. По мере развития исследований в области ИС возникла концепция знаний, которые объединили в себе многие черты процедурной и декларативной информации. В ЭВМ знания так же, как и данные, отображаются в знаковой форме - в виде формул, текста, файлов, информационных массивов и т.п. Поэтому можно сказать, что знания - это особым образом организованные данные. В системах ИИ знания являются основным объектом формирования, обработки и исследования. База знаний, наравне с базой данных, - необходимая составляющая программного комплекса ИИ. Машины, реализующие алгоритмы ИИ, называются машинами, основанными на знаниях, а подраздел теории ИИ, связанный с построением экспертных систем, - инженерией знаний. отличия между данными и знаниями: 1. внутренняя интерпретируемость знаний (например: данные – 243849..., знания – предложения естественного языка) 2. активность знаний. Если есть знания, то появления новых знаний может привести к изменению старых знаний и появлению новых. 3. связность знаний. Знания не интересны сами по себе, они интересны в совокупности (система знаний). 4. знания динамичны, а данные как правило статичны Интенсиональные знания определяются через понятие более высокого уровня с указанием специфических

То есть на некотором уровне знания ≡ данные

    Важно: знания задаются какэкстенсионально (эксплицитно, явно), то есть через набор конкретных фактов, соответствующих данному понятию, так иинтенсионально (неявно), то есть через свойства, соответствующие данному понятию.

Данные всегда задаются экстенсионально (явно).

    Внутренняя интерпретируемость знаний, в отличие данных.

Хранение в памяти вместе с элементами данных избыточность системы имён (например, хранить все лексические толкования (словарь)), то есть знания обладают множеством интерпретаций.

    Рекурсивная структурированность знаний (декомпозиция).

    Связанность (взаимосвязь) единиц знаний.

Наличие возможности установления различных отношений, отражающих семиотику и прагматику связей отдельных явлений и фактов, а также отношений отражающих смысл системы в целом, то есть можно задавать крупные единицы знаний как отдельные случаи (CBR).

Случай – как совокупность продукций – семантика.

Прагматика – отношение говорящего к предмету.

    Наличие у знаний семантического пространства с метрикой.

    Активность знаний, в отличие отданных.

То есть возможность ставить цели, достигать цели и т. д.

Активные объекты знаний – агенты.

Агенты обладают ментальными свойствами (то есть тем, что свойственно человеку).

    Функциональная целостность знаний.

    возможность выбора желаемых результатов средств анализа, достаточности полученного результата.

Таким образом, если выполняется совокупность вышеперечисленных свойств, то это знаний.

Сравнение соз(эс) и классических программных систем

    Сравнение технологий разработки.

      Обычная программа

      Система основанная на знаниях (СОЗ)

    Структура

    Сравнение параметров

Тип системы

Характеристики

Тип обработки

Методы решения задач

Задание шагов решение

Искомое решение

Управление и данные

Модификации

Достоверность информации

Символьная

Эвристический поиск

Удовлетворительное *

Перемешаны

Достоверная + недостоверная

Числовая

Алгоритмический поиск

Оптимальное

Разделены

Достоверная

* удовлетворительное – не хуже, чем человек-эксперт.

Недостоверная информация - ???НЕ-ФАКТОРЫ

Схема решения задач

Основные типы задач, при решении которых, использование соз даёт существенный результат.

Название


Модуль 1 (1,5 кредит): Введение в экономическую информатику

Тема 1.1: Теоретические основы экономической информатики

Тема 1.2: Технические средства обработки информации

Тема 1.3: Системное программное обеспечение

Тема 1.4: Сервисное программное обеспечение и основы алгоритмизации

Экономическая информатика и информация

1.1. Теоретические основы экономической информатики

1.1.2. Данные, информация и знания

Основные понятия данных, информации, знаний.

К базовым понятиям, которые используются в экономической информатике, относятся: данные, информация и знания. Эти понятия часто используются как синонимы, однако между этими понятиями существуют принципиальные различия.

Термин данные происходит от слова data - факт, а информация (informatio) означает разъяснение, изложение, т.е. сведения или сообщение.

Данные - это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.

Информация - это результат преобразования и анализа данных. Отличие информации от данных состоит в том, что данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач. Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

Существуют и другие определения информации, например, информация – это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний.

Знания – это зафиксированная и проверенная практикой обработанная информация, которая использовалась и может многократно использоваться для принятия решений.

Знания – это вид информации, которая хранится в базе знаний и отображает знания специалиста в конкретной предметной области. Знания – это интеллектуальный капитал.

Формальные знания могут быть в виде документов (стандартов, нормативов), регламентирующих принятие решений или учебников, инструкций с описанием решения задач.

Неформальные знания – это знания и опыт специалистов в определенной предметной области.

Необходимо отметить, что универсальных определений этих понятий (данных, информации, знаний) нет, они трактуются по-разному.

Принятия решений осуществляются на основе полученной информации и имеющихся знаний.

Принятие решений – это выбор наилучшего в некотором смысле варианта решения из множества допустимых на основании имеющейся информации.

Взаимосвязь данных, информации и знаний в процессе принятия решений представлена на рисунке.


Рис. 1.

Для решения поставленной задачи фиксированные данные обрабатываются на основании имеющихся знаний, далее полученная информация анализируется с помощью имеющихся знаний. На основании анализа, предлагаются все допустимые решения, а в результате выбора принимается одно наилучшее в некотором смысле решение. Результаты решения пополняют знания.

В зависимости от сферы использования информация может быть различной: научной, технической, управляющей, экономической и т.д. Для экономической информатики интерес представляет экономическая информация.