Главная Новости

Информационный поиск и семантический анализ корпуса текстов

Опубликовано: 13.12.2017

видео Информационный поиск и семантический анализ корпуса текстов

33. Морозова Ю.И. (Москва) Извлечение переводных соответствий из корпуса параллельных текстов с испо

В настоящее время, в эпоху глобальной компьютеризации, возникает потребность в обработке огромных массивов информации, с которыми человеку не справиться именно по причине их объема: информация устаревает и становится неактуальной, невероятно затруднен поиск. Использование ЭВМ позволяет во много раз повысить эффективность такого рода деятельности. Естественно, в чистом виде подобные операции неформализуемы и попытки смоделировать работу мозга пока еще к ошеломляющим результатам не привели.



С развитием Интернет и новых способов представления знаний, таких, как гипертекст, появилось много возможностей для концептуального представления информации. Это очень удобно, так как переводить текстовые документы в формат HTML просто. Как можно видеть, сеть даже в нашей стране развивается стремительно. Растет количество различных сайтов, представляющих информацию по разнообразным тематикам. Но вопрос структуризации так и остался неразрешенным. При наличии большого количества документов, которые нужно разместить на сайте организации, веб-мастер тратит очень много времени на то, чтобы: а) разобраться в имеющейся информации; б) систематизировать ее; в) реализовать структуру в Интернет. Задача, как мы видим, осложняется тем, что человек, занимающийся созданием сайтов не должен в общем случае иметь специальных знаний о сфере деятельности организации.


Корпусная лингвистика

Информационный поиск (ИП) - это область исследований, которая разрабатывает методы для обработки больших неструктурированных массивов информации, в том числе и текстовых массивов. Существует два основных направления исследований в ИП: улучшение автоматического поиска по запросу и улучшение ручного поиска. Первый применяется тогда, когда пользователь информационно-поисковых систем (ИПС) знает точно, что он хочет найти, второй, – когда он не может четко сформулировать запрос к системе или вообще не имеет представления о содержащихся в ней знаниях. Оба метода дополняют друг друга и показывают наибольшую эффективность при совместном использовании. Например, релевантность результатов автоматического поиска повышается, когда пользователь сужает область поиска до отдельной тематической категории.


Лекция 6.2 | Техники поиска в тексте задания (задачи) главной информации

Новости

Карта
rss