Автоматизирано създаване на семантични карти

31 Юли 2010
Posted by Trayan Momkov

Семантични карти

Семантичните карти са средство за представяне на знания. Те описват различни понятия и връзките между тях. Тематичните, понятийните и мисловните карти се припокриват до известна степен и представляват частни случаи на семантични карти.

Семантична карта - Стек

 

От друга страна семантичната карта е много малка семантична мрежа или по-скоро семантичната мрежа може да бъде съставена от много свързани помежду си карти. Пример за семантична мрежа е WordNet. Това е лексикална база данни на английския език. Достъпна е както онлайн - WordNet Search - 3.0, така и като десктоп приложение - WordNet - Download.

Класификация на Блум

Класификацията на Блум (наричана още Таксономия на Блум) и преработеният ѝ вариант представят знанието в шест категории:

  • Помнене
  • Разбиране
  • Прилагане
  • Анализиране
  • Оценяване
  • Създаване

Прието е класификация да бъде представена във възходяща йерархия, като най-ниската категория е помненето, а най-високата – създаването. Усвояването на всяка по-проста категория е необходимо условие, за да се усвои следващата – по-сложна.
За да се уточнят въпросите, които да задава ботът, при създаване на семантична карта бяха подбрани части от преработената класификацията на Блум и допълнени с нови идеи, което доведе до създаването на следната таблица:

Преработена класификация (таксономия) на Блум - въпроси

Бъбромати

Бъброматът представлява компютърна програма, проектирана да имитира интелигентен разговор с един или няколко човека, посредством гласови или най-често текстови съобщения. По принцип целта на тази имитация е да се заблудят потребителите, че съобщенията от програмата са написани от човек (тестът на Тюринг). Подобни програми понякога са наричани изкуствени единици за разговори, роботи (ботове) за разговор или разговорни кутии. В последно време бъбромати започват да се използват за практически цели, като онлайн помощници, персонализирани услуги или събиране на информация, в които случаи програмата работи, като разговорен агент. Това, което различава бъбромата от по-сложните системи за обработка на естествени езици е простотата на използваните алгоритми. Въпреки че много бъбромати изглежда сякаш тълкуват човешките съобщения интелигентно, те просто претърсват списък с ключови думи и изпращат отговор с най-близката до входното съобщение или генерират отговор по разпознат шаблон от база данни с шаблони.
Терминът „ChatterBot“ е въведен от Michael Mauldin (създател на първия вербален бот Джулия) през 1994 година.

Българският превод на този термин – „Бъбромат“ е въведен от Траян Момков през 2008 година, за назоваване на неговия, подобен на ELIZA бъбромат, който се намира на адрес http://trekto.info/bot

ELIZA е един от първите бъбромати. Една от най-известните ѝ роли е тази на психотерапевт. Без да използва почти никаква информация за мислите и емоциите на човека, ELIZA постига изумяващи резултати. Тя е написана в MIT (Massachusetts Institute of Technology –  Масачузетският технологичен институт) от Joseph Weizenbaum между 1964 и 1966 година.
Когато пациентът не предоставя почти никаква информация, ELIZA отговаря възможно най-общо. Например на съобщението „Боли ме главата“ се отговаря с „Защо казваш, че те боли главата?“. Отговор на съобщението „Моята майка ме мрази“ може да бъде „Кой друг от семейството ти те мрази?“. ELIZA е реализирана чрез разпознаване на шаблони, и все пак е взета на сериозно от няколко нейни събеседника, въпреки че Weizenbaum им е обяснил как работи.


Повече може да се прочете в дипломната работа на тема Автоматизирано създаване на семантични карти. Тя е придружена от презентация и рецензия.

Ботът, който създава семантичните карти се намира на адрес: http://trekto.info/semantic-bot

Публикувай нов коментар

  • Адресите на уеб-страници и e-mail адресите автоматично се конвертират в хипервръзки.
  • Разрешени HTML tag-ове: <a> <p> <span> <div> <h1> <h2> <h3> <h4> <h5> <h6> <img> <map> <area> <hr> <br> <br /> <ul> <ol> <li> <dl> <dt> <dd> <table> <tr> <td> <em> <b> <u> <i> <strong><font> <del> <ins> <sub> <sup> <quote> <blockquote> <pre> <address> <code> <cite> <embed> <object> <param> <strike> <caption>
  • Линиите и параграфите се прекъсват автоматично.
  • Mark language-dependent sections with == lc == where lc (or lc-xx) is a language code, other or all.

Повече информация за опциите на форматиране

CAPTCHA
Image CAPTCHA