ISSN 2071-8594

Российская академия наук

Главный редактор

Г.С. Осипов

В.И. Городецкий, О.Н. Тушканова Семантические технологии для семантических приложений. Часть 1. Базовые компоненты семантических технологий

Аннотация.

В работе обсуждаются базовые аспекты современного понимания семантических вычислений, семантических технологий и семантических приложений в искусственном интеллекте. Приводится базовая терминология, используемая в работе, и даются конкретные примеры семантических приложений, в том числе, индустриального уровня. Показано, что базовыми компонентами семантических технологий искусственного интеллекта являются онтологии и семантические модели их использования, семантические ресурсы, которые содержат знания о семантике слов и других сущностей естественного языка и средства уточнения этой семантики, а также семантическая компонента технологии, которая используется для формального описания смысла сущностей естественного языка и численной оценки их попарной семантической близости. Обсуждаются доступные семантические ресурсы, и дается их сравнительный анализ. Приводятся сведения о типах сущностей естественного языка (примитивах), которые далее практически используются для построения моделей формального описания смысла текстов в различных семантических приложениях. Последние компоненты описания семантики текстов составляют содержание второй части данной работы.

Ключевые слова:

семантика естественного языка, семантические технологии, семантические вычисления, семантическое приложение, онтология, семантический ресурс.

Стр. 61-71.

DOI 10.14357/20718594180406

Литература

1. Bartussek W., Bense H., Hoppe T., Humm B.G., Reibold A., Schade U., Siegel M., Walsh P. Introduction to Semantic Applications. In Thomas Hoppe, Bernhard Humm, Anatol Reibold (Eds.). Semantic Applications. Methodology, Technology, Corporate Use. Springer-Verlag GmbH Germany, part of Springer Nature 2018.
2. Gruber T.R. A translation approach to portable ontologies. Knowledge Acquisition. Academic Press, 1993, 5(2), pp. 199-220.
3. Uciteli A., Goller C., Burek P., Siemoleit S., Faria B., Galanzina H., Weiland T., Drechsler-Hake D., Bartussek W., Herre H.. Search ontology, a new approach towards semantic search. In: Plödereder E, Grunske L, Schneider E, Ull D (eds) FoRESEE: Future Search Engines, 2014, 44. Annual meeting of the GI, Stuttgart – GI edition proceedings LNI. Köllen, Bonn, pp. 667-672.
4. Beger C, Uciteli A., Herre H. Light-weighted automatic import of standardized ontologies into the content management system Drupal. Stud Health Technol Inform 243, 2017, pp. 170-174.
5. Diwisch K., Engel F., Watkins J., Hemmje M. Managing Cultural Assets: Challenges for Implementing Typical Cultural Heritage Archive’s Usage Scenarios. In: Hoppe T., Humm B., Reibold A. (eds) Semantic Applications. Springer Vieweg, Berlin, Heidelberg, 2018, pp. 219-229.
6. Bollegala D., Yutaka Matsuo Y., Ishizuka M. WebSim: a Web-based Semantic Similarity Measure. The 21st Annual Conference of the Japanese Society for Artificial Intelligence, 2007, pp. 1-4.
7. Humm B.G., Ossanloo H. A semantic search engine for software components. IADIS Press, Mannheim, 2016, pp. 127–135.
8. Fillies C., Weichhardt F., Straub H. The Semantic Process Filter Bubble. In: Hoppe T., Humm B., Reibold A. (eds) Semantic Applications. Springer Vieweg, Berlin, Heidelberg, 2018, pp. 231-241.
9. Feng Y., Bagheri E., Ensan F., Jovanovic J. The state of the art in semantic relatedness: a framework for comparison. Knowledge Engineering Review, 2017, pp. 1-30.
10. Miller A., R. Beckwith R., Fellbaum C.D., Gross D., Miller K. WordNet: An online lexical database. International Journal Lexicograph. 1990, 3, pp. 235-244.
11. Европейский WordNet. http://www.illc.uva.nl/EuroWordNet.
12. Азарова И.В., Митрофанова О.А., Синопальникова А.А. Компьютерный тезаурус русского языка типа WordNet. http://project.phil.spbu.ru/RussNet/papers/RussNet_dialog2003.pdf
13. Сухоногов А.М., Яблонский С.А. Разработка русского WordNet. http://www.interface.ru/iarticle/files/36053_78003690.pdf.
14. Gupta A., Oates T. Using Ontologies and the Web to Learn Lexical Semantics. Proceedings of the 20th international joint conference on Artificial intelligence, January 06-12, 2007, Hyderabad, India, pp. 1618-1623.
15. Пархоменко П.А., Григорьев А.А., Астраханцев Н.А. Обзор и экспериментальное сравнение методов кластеризации текстов. Труды ИСП РАН, 2017, том 29, выпуск 2, c. 161-200.
16. Slonim N., Friedman N., Tishbyi N. Document Clustering Using Word Clusters via the Information Bottleneck Method. Proceedings of the 23rd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. ACM. 2000, pp. 208-215.
17. Астраханцев Н.А. Методы и программные средства извлечения терминов из коллекции текстовых документов предметной области. Диссертация на соискание ученой степени кандидата физико-математических наук. Институт системного программирования РАН, Москва, 2014.
18. Kosa V., Chaves-Fraga D., Naumenko D., Yuschenko E., Badenes-Olmedo C., Ermolayev V., Birukou A. Cross-Evaluation of Automated Term Extraction Tools. Technical Report TS-RTDC-TR-2017-1, 30.09.2017. Dept of Comp. Science, Zaporizhzhia National University, Ukraine, 61 p.
19. Deerwester S., Dumais S.T., Furnas G.W., et al. Indexing by latent semantic analysis. Journal of the American Society for Information Science, volume 41, issue 6, 1990, pp. 391-407.
20. Morris J., Hirst G. Lexical cohesion computed by thesaural relations as an indicator of the structure of text. Computational Linguistics, 1991, vol. 17, 1, pp. 21-43.
21. Ткач С.С. Применение лексических цепочек для разрешения лексической многозначности на основе Русского Викисловаря. Магистерская диссертация. Петрозаводский Государственный университет. Петрозаводск, 2016. 60 с.
22. Wei T., Lu Y., Chang H., Zhou Q., Bao X. A semantic approach for text clustering using WordNet and lexical chains. Expert Systems with Applications 42, 2015, pp. 2264-2275.