КОМПЬЮТЕРНЫЕ ОНТОЛОГИИ - ТЕХНОЛОГИЧЕСКАЯ ОСНОВА ФОРМИРОВАНИЯ☛Информационные технологии ✎ |
Ключевые слова: информационная модель, онтология, морфология, тезаурус, лингвистический и структурный анализ, база знаний. Постановка проблемы в общем виде. Одним из перспективных направлений дальнейшего совершенствования электронных систем обучения является разработка методологических, онтологических и логических основ конструирования баз знаний учебного назначения (БЗНП) [2, 3, 6, 9, 15]. До онтологических аспектов относится круг вопросов, начиная от сферы применения и к формальному описанию компонентов компьютерных онтологий предметных дисциплин. Главный вектор исследований направлен на формализацию этапов построения, структурирования и подачи материала предметной дисциплины при обучении и интегрированного с информационным учебным ресурсом проблемного пространства, что позволяет получить эффективное сочетание усвоения лекционного и лабораторного материалов. В свою очередь,
эффективная реализация указанных этапов и получения конечного результата (в виде библиотеки онтологических баз знаний предметных дисциплин) невозможна без проведения системно-онтологического анализа заданной совокупности информационных обучающих ресурсов.
Анализ последних исследований и изложение основного материала
Современные исследования определенной проблематике в основном рассматривают средства обработки языковых данных. Эти средства строятся на основе «внутриязыковых» и «Компьютерной» сферами разработки и выполняются в ходе реализации соответствующего алгоритма, использующего базу «языковых знаний» (основой которого является языково- онтологическая картина мира (МОКС)) и базу знаний заданной предметной области (ПДО). Цепочка информационных технологий - компьютерное обработки естественноязыковых текстов → представления знаний → компьютерное обработки базы знаний представляет реализацию базовых процедур анализа, синтеза и распознания естественного языка компьютером, в более общем смысле можно выразить продукционных цепочкой входящее сообщение ® система знаний ® результат. Суть этой цепочки определяется междисциплинарной системной интеграцией лингвистических и предметных знаний, вообще, является новой информационной технологии, которая находится в стадии становления и интенсивного развития исследований [9, 13, 16]. Но педагогические и методические аспекты использования данных технологических решений вообще требуют отдельного исследования. Это обусловлено тем, что информационные ресурсы в настоящее время достаточно интенсивно развиваются и это имеет значительный влияние на современный образовательный процесс. Условия формирования образовательных информационных ресурсов описаны в исследованиях, изложены в следующих источниках - [1-3, 4, 5, 8, 9, 10-14].
В этой работе рассмотрены онтологический аспект проектирования баз знаний учебного назначения, который является одним из важных практических применений направления онтологического инжиниринга. С помощью предложенного подхода могут быть решены, а также улучшены результаты решения следующих актуальных задач в области образования:
· Автоматизированная разработка баз знаний учебного назначения на основе лингво-семантического анализа больших объемов текстовой информации с использованием оригинальных инструментальных средств. Вместе исходная текстовая информация может использоваться из различных источников, например из апробированных в учебных
заведениях учебников на украинском и русском языках с предметной дисциплины;
· Структурирование терминов и понятий, содержащихся в информационных учебных ресурсах по определенной предметной дисциплины;
· Существенное уменьшение трудоемкости составления баз знаний учебного назначения.
Компьютерные онтологии - это раздел информатики, как теоретической, так и практической, интенсивно развивается [3, 8, 9, 14]. Компьютерную онтологию некоторой предметной дисциплины можно рассматривать как общезначимое, открытую базу знаний, содержащуюся общепринятой (формальной) языком спецификации знаний. В онтолого-классификационной схеме средств и методов искусственного интеллекта онтологический подход трактуется как разновидность системного подхода, основанного на знаниях. Онтологический подход обеспечивает эффективное проектирование компонентов любой знание-ориентированной информационной системы.
Электронный учебный ресурс должен иметь все структурные элементы, определяют аксиоматизации научных знаний: аксиомы или схемы аксиом; выходные (Первичные) понятия, правила вывода и построения системы знаний; определения;
теоремы, следствия, положения, выведенные из теории, логико-методологические принципы аксиоматизуючои теории.
Произвольная онтология (простая, смешанная или формальная) эффективна, прежде всего, в обучении. Действительно, гораздо эффективнее показать ученику онтограф предметной чем описывать концепты дисциплины и их связи с другими средствами. Онтология структурирует знания некоторой предметной области в соответствии с онтологических принципов. Преподавателю онтология (особенно компьютерная) облегчит разработку учебного курса, студенту - улучшит восприятие учебного материала и межпредметных связей. Исходя из этого, можно ожидать значительного эффекта улучшение качества формирования знаний предметной дисциплины путем применения онтологий в образовании. Наиболее полно преимущества онтолого-управляемой информационной системы учебного назначения проявляются при использовании и взаимодействия онтологий двух уровней - онтологии домена предметных дисциплин и онтологий самих предметных дисциплин.
Использование онтологии как компонента интерфейса особенно важно при автоматизированного создания баз знаний учебного назначения, потому что онтология включает семантическую информацию относительно ограничений, наложенных на понятия и их взаимосвязь. Онтологии, например, могут быть применены для
генерации интерфейсов БЗНП, отвечающих за проверку нарушения ограничений. Преподаватель и учащийся могут ознакомиться с онтологией, чтобы лучше понять терминологический словарь, используемый в предметной дисциплине.
Реализация указанных технологий требует учета различных формально- методологических требований, критериев и оценок. Приведем основные из них.
1. Построение информационной и функциональной моделей предметных дисциплин.
2. Необходимость структурирования терминов и понятий. 3. Правила формирования достоверных утверждений и выводов, описывающих термины и понятия предметных дисциплин. 4. Поддержка онтологии домена предметных дисциплин. При разработке информационного учебной среды одним из первых встает задача описания понятийной структуры учебной дисциплины. Важно, что в процессе обучения или подготовки исследования можно изучать не только отдельный термин (понятие), но и получать все семантические связи с другими понятиями, тем самым осмысливая его роль в данной системе знаний или в ходе решения задачи. Этим и обусловлено использование тезауруса - упорядоченного множества основных терминов-понятий данной учебной дисциплины и характерных для нее семантических связей между понятиями [2, 5, 6, 15].
Однако тезаурус может выступать не только средством организации базы знаний. Расширяя его функции, тезаурус можно превратить в среду, в которой
обеспечивается активизация работы, а также оригинально решаются учебные задачи. Кроме декларативных свойств знаний, которые описываются тезаурусною моделью, ее средствами можно также подавать содержание объектов учебной дисциплины через их конструирования. Причем как для преподавателя, так и для ученика проектируются режимы работы на основе известной схемы «администратор - пользователь».
Различные проблемные ситуации в ходе решения задач в тезаурусе можно моделировать на понятийном уровне - не указывая конкретные числовые значения, метрические соотношения и др.. Не упрощая процесс решения задачи приведением его к одной подстановки числовых величин в определенные параметры, отметим, что моделирование задачи на более обобщающем уровне имеет и более общее значение, чем только нахождение конкретного результата, а, значит, и более широкую основу для интерпретации.
Отдельным важным этапом является отбор основных понятий для учебного тезауруса. Поскольку его разработка одним только экспертом по предметной области (например, преподавателем) является сложным процессом, необходимо тесное сотрудничество между специалистом по управления базами знаний и экспертом на всех этапах работы [2, 15]. Это взаимодействие может происходить двумя способами. В первом случае специалист по управлению базами
знаний разрабатывает первый вариант тезауруса согласно определенной методики, консультируясь с экспертом относительно содержания знаний. Во втором случае эксперт по предметной области сам разрабатывает тезаурус, пользуясь предложенной методике и консультируясь со специалистом по управлению базами знаний по правильному ее применения. Отбор понятий для учебного тезауруса и определения семантических связей между ними является довольно сложным процессом и проводится по специальной методике. Построение тезауруса осуществляется в несколько этапов:
· Определение учебной дисциплины;
· Составления словаря (подбор понятий). На этом этапе необходима кропотливая работа со специальной литературой, соответствующими толковыми словарями (если такие есть), учебниками, методическими материалами, учебными пособиями, стандартами и т.п.;
· Определение понятий;
· Определение перечня семантических связей между понятиями данной учебной дисциплины;
· Толкование семантических связей (определение их содержания);
· Построение семантической сети связей понятий;
· Конструирование схемы словарной статьи тезауруса (понятия, его краткое определение, перечень семантических связей с другими понятиями);
· Формирование состава словарных статей тезауруса.
Построение тезауруса - чрезвычайно сложный и трудоемкий процесс. Каждый этап связан с анализом многих вариантов. А конечный результат работы являются новым интеллектуальным продуктом. Для этого необходимо обеспечить реализацию определенных условий к которым, в первую очередь, нужно отнести следующее:
· Четкое понимание цели и направления учебной деятельности - постановка задачи;
· Достаточная информационная база;
· Полное описание объектов предметной области в соответствии с технологической платформы (технологической платформой могут быть такие системы: Convera, Exalead, Галактика Zoom, Информбюро и другие);
· Организация работы экспертов и / или аналитических групп заданной темы предметной области.
Кроме этого, необходимо отдельно отметить, что формирование знаний об объекте возможно лишь при условии единства трех компонентов:
· Совокупность достаточных массивов информации;
· Знаний и опыта экспертов и специалистов (аналитиков, методистов, преподавателей);
· Эффективного аналитического инструментария (например, Convera, Exalead, Галактика Zoom, Информбюро т.д.).
Во время отбора данных и разработки лингвистических ресурсов (ЛР) необходимо учитывать, что является объектом исследования - предметная область, ее тематический раздел, процессы, свойства, функциональное описание подобное. Объект является особым узнаваемым предметом, блоком или естеством (реальным или абстрактным), что имеет важное функциональное назначение в данной предметной области. Объект имеет структуру, свойства, состояние, выявляет четкую функциональность, может иметь пределы. Группа или множество объектов, имеющих связи и связанные общей структурой и функциональностью могут быть объединены в классы.
Исследование информационного пространства с точки зрения получения наиболее полных данных о предметной области предусматривает следующее:
а) подбор данных об объекте в целом:
· Название объекта;
· Его структура и класс;
· Близкое окружение;
· Информационные источники;
· Дальнее окружение;
· Связи и отношения и т.д.;
б) отбор данных об объекте в контексте цели, определенной в учебном процессе:
· Описание объектов его тематик как сфер учебной деятельности;
· Исследование функциональных свойств;
в) отбор данных по объекту с точки зрения его определения:
· Описание сфер его применения как пространства решения задач;
· Описание пересечения с другими объектами;
г) анализ и оценку собранных данных;
д) составление информационного портрета объекта (агрегированные описания, аналитические записки, структурное описание, перечень свойств и т.п.);
е) дальнейший мониторинг информационного поля с целью постоянного распространения информационных описаний объекта.
Создание информационной базы данных - ключевой момент указанного процесса.
Базы данных должны быть представлены в электронном виде и отвечать поставленной задачей.
В целом информационная база данных строится:
а) на основе:
· Внешних источников данных;
· Внутренних источников данных;
б) по каналам:
· Внутренними каналами данных (локальные ресурсы учебного заведения, печатные издания и т.п.);
· Открытыми каналами данных (доступны в Интернете библиотечные ресурсы, СМИ (печатные издания, электронные); видеоисточника т.д.);
в) на подборе:
· Максимально полной базы данных об объектах исследования, исходя из поставленных задач и выбранных источников информации.
Темы онтологических описаний определяются поставленными задачами учебного процесса. Для создания наиболее полной картины исследования необходимо проработать и предусмотреть возможные применения объекта и его составляющих как при отбора данных, так и разработки лингвистических ресурсов, которые должны обеспечить создание базы знаний об объекте.
Весь процесс отбора, обработки, анализа информации и синтеза уже полученных знаний является рядом определенных последовательных циклов. Исследовательский цикл, как правило, состоит из следующих основных этапов:
· Постановка задачи;
· Целеполагания и планирования;
· Осознание задачи, его составляющих, описывающих сферу исследования;
· Отбор данных;
· Определение предметных областей, описывающих сферу исследования;
· Подбор словарей, тезаурусов, классификаторов и других материалов, описывают наглядные отрасли;
· Формирование баз данных (библиотек);
· Обработка данных - анализ с помощью соответствующих методов и инструментов;
· Структуризация собранных данных (выбор формата и носителей);
· Проработка и подготовка материала;
· Определение тематик доменных картриджей, таксономий, классификаций и их комбинаций для разработки ЛР;
· Разработка и тестирование ЛР;
· Определение круга пользователей ЛР и баз данных;
· Использование информации в процессе принятия и исполнения решений.Использование предложенного метода построения модели знаний учебной дисциплины позволяет также разнообразить процесс обучения и сделать его более персонифицированным. Это достигается за счет того, что ученик имеет возможность спользовать свой собственный опыт, строить свои модели знаний, экспериментировать с различными вариантами решения задач, активно используя функциональность компьютерного тезауруса. Методика обучения системам понятий в среде тезауруса определенной степени является иллюстрацией принципа обучения на основе исследования и открытие.
Во время отбора данных и разработки лингвистических ресурсов (ЛР) необходимо учитывать, что является объектом исследования - предметная область, ее тематический раздел, процессы, свойства, функциональное описание подобное. Объект является особым узнаваемым предметом, блоком или естеством (реальным или абстрактным), что имеет важное функциональное назначение в данной предметной области. Объект имеет структуру, свойства, состояние, выявляет четкую функциональность, может иметь пределы. Группа или множество объектов, имеющих связи и связанные общей структурой и функциональностью могут быть объединены в классы.
Исследование информационного пространства с точки зрения получения наиболее полных данных о предметной области предусматривает следующее:
а) подбор данных об объекте в целом:
· Название объекта;
· Его структура и класс;
· Близкое окружение;
· Информационные источники;
· Дальнее окружение;
· Связи и отношения и т.д.;
б) отбор данных об объекте в контексте цели, определенной в учебном процессе:
· Описание объектов его тематик как сфер учебной деятельности;
· Исследование функциональных свойств;
в) отбор данных по объекту с точки зрения его определения:
· Описание сфер его применения как пространства решения задач;
· Описание пересечения с другими объектами;
г) анализ и оценку собранных данных;
д) составление информационного портрета объекта (агрегированные описания, аналитические записки, структурное описание, перечень свойств и т.п.);
е) дальнейший мониторинг информационного поля с целью постоянного распространения информационных описаний объекта.
Создание информационной базы данных - ключевой момент указанного процесса. Базы данных должны быть представлены в электронном виде и отвечать поставленной задачей.
В целом информационная база данных строится:
а) на основе:
· Внешних источников данных;
· Внутренних источников данных;
б) по каналам:
· Внутренними каналами данных (локальные ресурсы учебного заведения, печатные издания и т.п.);
· Открытыми каналами данных (доступны в Интернете библиотечные ресурсы, СМИ (печатные издания, электронные); видеоисточника т.д.);
в) на подборе:
· Максимально полной базы данных об объектах исследования, исходя из поставленных задач и выбранных источников информации. Темы онтологических описаний определяются поставленными задачами учебного процесса. Для создания наиболее полной картины исследования необходимо проработать и предусмотреть возможные применения объекта и его составляющих как при отбора данных, так и разработки лингвистических ресурсов, которые должны обеспечить создание базы знаний об объекте.
Весь процесс отбора, обработки, анализа информации и синтеза уже полученных знаний является рядом определенных последовательных циклов. Исследовательский цикл, как правило, состоит из следующих основных этапов:
· Постановка задачи;
· Целеполагания и планирования;
· Осознание задачи, его составляющих, описывающих сферу исследования;
· Отбор данных;
· Определение предметных областей, описывающих сферу исследования;
· Подбор словарей, тезаурусов, классификаторов и других материалов, описывают наглядные отрасли;
· Формирование баз данных (библиотек);
· Обработка данных - анализ с помощью соответствующих методов и инструментов;
· Структуризация собранных данных (выбор формата и носителей);
· Проработка и подготовка материала;
· Определение тематик доменных картриджей, таксономий, классификаций и их комбинаций для разработки ЛР;
· Разработка и тестирование ЛР;
· Определение круга пользователей ЛР и баз данных;
· Использование информации в процессе принятия и исполнения решений. Использование предложенного метода построения модели знаний учебной дисциплины позволяет также разнообразить процесс обучения и сделать его более персонифицированным. Это достигается за счет того, что ученик имеет возможность использовать свой собственный опыт, строить свои модели знаний, экспериментировать с различными вариантами решения задач, активно используя функциональность компьютерного тезауруса. Методика обучения системам понятий в среде тезауруса определенной степени является иллюстрацией принципа обучения на основе исследования и открытие.
Офисные пакеты и системы, их классификация, история развития и основные свойства
Компания motorola разместила информацию на своем сайте о новой модели мобильного телефона motokey social
5800 xpress music
Техническое и программное обеспечение как средство управления информационными ресурсами
Развитие информационных технологий
10 незаменимых библиотек Python для машинного обучения
Python vs JavaScript: Что учить первым в этом году?


Тест: Какая IT-профессия подходит именно вам?
Путь фронтендера: С чего начать и куда расти дальше?