ISSN 2071-8594

Российская академия наук

 

Г. С. Осипов, А. И. Панов "Синтез рационального поведения когнитивного семиотического агента в динамической среде"

Аннотация.

В работе представлена общая архитектура когнитивного семиотического агента, действующего в динамической среде. Предложена новая реализация и интеграция блоков планирования и обучения агента, которая позволяет решить проблему привязки символов. изложен новый подход к описанию семантического уровня компонент знаковой картины мира, который используется в качестве базового при генерации рационального поведения агента. Дано формальное определение сценария поведения и его использование при генерации плана действий рационального агента. Описан модельный эксперимент, демонстрирующий работу семиотического агента в игровой среде.

Ключевые слова:

семиотический агент, знаковая картина мира, каузальные сети, семиотическая сеть, планирование, обучение с подкреплением.

Стр. 80-100.

DOI 10.14357/20718594200408

Литература

1. Поспелов Д.А. Десять «горячих точек» в исследованиях по искусственному интеллекту // Искусственный интеллект и принятие решений. 2019. № 4. С. 3-9.
2. Осипов Г.С. Методы искусственного интеллекта. М.: Физматлит. 2015. С. 297.
3. Schwarting W., Alonso-Mora J., Rus D. Planning and De-cision-Making for Autonomous Vehicles // Annual Re-view of Control, Robotics, and Autonomous Systems. 2018. Vol. 1, № 1. P. 187–210.
4. Ghallab M., Nau D., Traverso P. Automated Planning and Acting // Automated Planning and Acting. 2016. P. 1–354.
5. Rankooh M. ITSAT: An Efficient SAT-Based Temporal Planner // Journal of Artificial Intelligence Research. 2015. Vol. 53. P.541-632.
6. Richter S., Westphal M. The LAMA planner: Guiding cost-based anytime planning with landmarks // Journal of Artificial Intelligence Research. 2010. Vol 39. P. 127-177.
7. Alford R., Shivashankar V., Roberts M., Frank J., Aha D. Hierarchical planning: Relating task and goal decomposition with task sharing // IJCAI International Joint Conference on Artificial Intelligence. 2016. P.3022-3028.
8. Cardoso R., Bordini R. Decentralised Planning for Multi-Agent Programming Platforms AAMAS. 2019. P.799-807.
9. Киселев Г., Панов А. Знаковый подход к задаче распределения ролей в коалиции когнитивных агентов // Труды СПИИРАН. 2018 (2). C.161-187.
10. Borrajo D., Roubíčková A., Serina I. Progress in Case-Based Planning // ACM Computing Surveys. 2015 vol: 47 (2). P.1-39.
11. Рыбина Г.В., Блохин Ю.М. Методы и средства интеллектуального планирования: применение для управления процессами построения интегрированных экспертных систем // Искусственный интеллект и принятие решений. 2015. № 1. С. 75-93.
12. B Wang Z Kaelbling L Lozano-Pérez T Learning to guide task and motion planning using score-space representationKim International Journal of Robotics Research. 2019 vol: 38 (7). P.793-812.13. Harnad S Symbol Grounding Problem // Physica. 1990 vol: 42. P.335-346.
14. Besold T Kuhnberger K Towards integrated neural-symbolic systems for human-level AI: Two research programs helping to bridge the gaps // Biologically Inspired Cognitive Architectures 2015 vol: 14. P.97-110.
15. Kaelbling L Lozano-Pérez T Integrated task and motion planning in belief space // The International Journal of Robotics Research. 2013 vol: 32 (9-10). P.1194-1227.
16. Тарасов В. От многоагентных систем к интеллектуальным организациям: философия, психология, информатика // М.: Эдиториал УРСС. 2002 С. 352.
17. Карпов В.Э., Тарасов В.Б. От коллаборативной робототехники к социальным роботам для поддержки людей с ограниченными возможностями: новые направления разработки использования интеллектуальных агентов // Интеллектуальные технологии и средства реабилитации людей с ограниченными возможностями (ИТСР-2018). Труды III международной конференции. 2018. C. 20-29.
18. Ali Dorri; Salil S. Kanhere ; Raja Jurdak Multi-Agent Systems: A Survey // IEEE Access. 2018. P.28573 – 28593.
19. Snaider J Franklin S Vector LIDA // Procedia Computer Science. 2014 vol: 41. P.188-203.
20. Leandro Carlos Fernandes etc. CaRINA Intelligent Robotic Car: Architectural Design and Applications // Journal of Systems Architecture 60(4).
21. Goertzel B., Pennachin C., Geisweiller N. (2014) The OpenCog Framework. In: Engineering General Intelligence. Part 2. Atlantis Thinking Machines/ vol 6. Atlantis Press. Paris.
22. Laird J. The Soar Cognitive Architecture. MIT Press. 2012. P.374.
23. Bothell D . ACT-R 7 Reference Manual. Carnegie Mellon University. 2015.P.516.
24. Hélie S., Sun R. Autonomous learning in psychologically-oriented cognitive architectures: A survey // New Ideas in Psychology. 2014. vol: 34 (1). P.37-55.
25. Samsonovich A. Emotional biologically inspired cognitive architecture // Biologically Inspired Cognitive Architectures. 2013. vol: 6. P.109-125.
26. George D., Hawkins J. Towards a mathematical theory of cortical micro-circuits // PLoS computational biology. 2009. vol: 5 (10). P.1000532.
27. Hawkins J., Ahmad S., Cui Y. A Theory of How Columns in the Neocortex Enable Learning the Structure of the World // Frontiers in Neural Circuits. 2017. Vol. 11. P. 1–18.
28. Dileep George etc. A generative vision model that trains with high data efficiency and breaks text-based CAPTCHAs // Science 08 Dec 2017 Vol. 358, Issue 6368, eaag2612.
29. Schmidhuber J. Deep Learning in Neural Networks: An Overview // Neural Networks. 2015. vol: 61. P.85-117.
30. Manhaeve R., Kimmig A. DeepProbLog : Neural Proba-bilistic Logic Programming arXiv:1805.10872v2.
31. Besold T. Etc Neural-Symbolic Learning and Reasoning: A Survey and Interpretation. 2017. P.1-58.
32. Ghidini C Serafini L Distributed First Order Logic // Artificial Intelligence. 2017. vol: 253. P.1-39.
33. Schaul T Horgan D Gregor K Silver D. Universal Value Function Approximators // Proceedings of The 32nd Interna-tional Conference on Machine Learning. 2015. P.1312-1320.
34. Mnih V Kavukcuoglu K Silver D Graves A Antonoglou I Wierstra D Riedmiller M Playing Atari with Deep Rein-forcement Learning arXiv: 1312.5602. 2013.
35. Vinyals O., Babuschkin I., Czarnecki W. M., Mathieu M., Dudzik A., Chung J., D., Choi H., Powell R., Ewalds T., Georgiev P., et al. Grandmaster level in StarCraft II using multi-agent reinforcement learning.Nature. 2019.
36. Silver D., Hubert T., Schrittwieser J., Antonoglou I., Lai M., Guez A., Lanctot M., Sifre L., Kumaran D., Graepel T., et al. A general reinforcement learning algorithm that masters chess, shogi, and go through self-play.Science. 362. 2018.
37. Julian Schrittwieser and etc. Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model. 2019 ArXiv 1911.08265.
38. Кузнецова Ю Осипов Г Панов А Петров А Чудова Н Моделирование поведения, управляемого сознанием // Системный анализ и информационные технологии: тр. Четвертой междунар. конф. (Абзаково, Россия, 17–23 авг. 2011 г.): в 2т. Челябинск: Изд-во Челяб. Гос. ун–та. 2011. Т. 1 С. 6-13.
39. Осипов Г.С. и др. Знаковая картина мира субъекта по-ведения. М.: Физматлит. 2018. С. 264.
40. Осипов Г.С., Панов А.И., Чудова Н.В. Управление поведением как функция сознания. I. Картина мира и целеполагание // Известия РАН. Теория и системы управления. 2014. № 4. С. 49–62.
41. Чудова Н.В. Концептуальное описание картины мира для задачи моделирования поведения, основанного на сознании // Искусственный интеллект и принятие решений. 2012. № 2. С. 51–62.
42. Paraense A., Raizer K., Gudwin R. A machine conscious-ness approach to urban traffic control // Biologically Inspired Cognitive Architectures. 2016. vol: 15. P.61-73.
43. Madl T., Franklin S., Chen K., Trappl R. A computational cognitive framework ofspatial memory in brains and robots, Cognitive Systems Research. 2017.
44. Осипов Г. Динамические интеллектуальные системы // Искусственный интеллект и принятие решений. 2008. №1. С.47-54.
45. Schulman J Wolski F Dhariwal P Radford A Klimov O. Proximal Policy Optimization Algorithms. 2017. P.1-12.
46. Soft Actor-Critic Algorithms and Applications. Haarnoja et al, 2018.
47. Choi, D., & Langley, P. (2018). Evolution of the ICARUS Cognitive Architecture. Cognitive Systems Research. https://doi.org/10.1016/j.cogsys.2017.05.005.
48. Yi Wu. Learning andplanning with asemanticmodel. 2018. Arxiv 1809.10842.
49. Vin ent ran ois-Lavet. Combined Reinforcement Learning via Abstract Representations // The Thirty-Third AAAI Conference on Artificial Intelligence (AAAI-19).
50. Minsky M. L. Frame-system theory //Thinking. 1977.
51. Pichotta K., Mooney R. J. Learning statistical scripts with LSTM recurrent neural networks //Thirtieth AAAI Con-ference on Artificial Intelligence. 2016.
52. Donadello I, Serafini L., Garcez A. Logic Tensor Net-works for Semantic Image Interpretation // Proceedings of the 26th International Joint Conference on Artificial Intelligence (IJCAI'17). 2017. P.1596-1602.53. Kleyko D., Rahimi A., Rachkovskij D., Osipov E., Rabaey J. Classification and Recall With Binary Hyperdimensional Computing: Tradeoffs in Choice of Density and Mapping Characteristics // IEEE Transactions on Neural Networks and Learning Systems. 2018. vol: 29 (12). P.5880-5898.
54. Леонтьев А.Н. Деятельность. Сознание. Личность. М.: Политиздат. 1977. 304 с.
55. Выготский Л.С. Мышление и речь // Психология развития человека / Под ред. С. Бобко. М.: Эксмо. 2005. С. 664–1019.
56. Чудова Н.В. Актуальные проблемы моделирования целеполагания в знаковой картине мира. Взгляд психолога // Искусственный интеллект и принятие решений. 2020. № 1. С. 70-79.
57. Чудова Н.В. Психологические аспекты планирования в знаковой картине мира // Шестнадцатая национальная конференция по искусственному интеллекту с международным участием-КИИ-2018. Труды конференции в 2-х томах. 2018. С. 88-95.
58. Панов А.И., Яковлев К.С. Взаимодействие стратегиче-ского и тактического планирования поведения коалиций агентов в динамической среде // Искусственный интеллект и принятие решений. 2016. № 4. С. 68–78.
59. Kiselev G., Panov A. Hierarchical Psychologically Inspired Planning for Human-Robot Interaction Tasks // Interactive Collaborative Robotics. ICR 2019. Lecture Notes in Computer Science. 2019. vol: 11659. P.150-160.
60. Осипов Г.С., Панов А.И., Чудова Н.В. Управление поведением как функция сознания. II. Синтез плана поведения // Известия РАН. Теория и системы управления. 2015. № 6. С. 47–61.
61. Панов А. Целеполагание и синтез плана поведения когнитивным агентом // Искусственный интеллект и принятие решений. 2018. №2. С.21-35.
62. Чудова Н.В., Кузнецова Ю.М. Концептуальная модель самосознания для знаковой картины мира интеллектуального агента // Искусственный интеллект и принятие решений. 2018. № 4. С. 86-94.
63. Осипов Г.С., Поспелов Д.А. Прикладная семиотика // Новости искусственного интеллекта. 1999. № 1. С. 9–35.
64. Панов А.И. Формирование образной компоненты знаний когнитивного агента со знаковой картиной мира // Информационные технологии и вычислительные системы. 2018. № 4. С. 84–96.
65. Osipov G.S. Sign-based representation and word model of actor // 2016 IEEE 8th International Conference on Intelligent Systems (IS) / ed. Yager R. et al. IEEE. 2016. P. 22–26.
66. Osipov G.S. Signs-Based vs. Symbolic Models // Advances in Artificial Intelligence and Soft Computing / ed. Sidorov G., Galicia-Haro S.N. Springer International Pub-lishing. 2015. P. 3–11.
67. Осипов Г., Панов А. Отношения и операции в знаковой картине мира субъекта поведения // Искусственный интеллект и принятие решений. 2017. №4. С.5-22.
68. George D. How the Brain Might Work: a Hierarchical and Temporal Model for Learning and Recognition// PhD Stanford University. 2008 (June). Р.191.
69. Hengst B. Hierarchical Approaches // Reinforcement Learning. 2012. P.293-323.
70. Levy A., Platt R., Saenko K. Hierarchical Actor-Critic. 2018.
71. Pierre-Luc Bacon and Jean Harb and Doina Precup The Option-Critic Architecture.
72. Суворова М.И., Кобозева М.В., Соколова Е.Г., Толдова С.Ю.Извлечение сценарной информации из текстов. Часть 1. Постановка задачи и обзор методов // Искусственный интеллект и принятие решений. 2020. № 1. С. 17-26.
73. Золотова Г. А., Онипенко Н. К., Сидорова М. Ю. Коммуникативная грамматика русского языка. М.: Институт русского языка им. В. В. Виноградова РАН. 2004.
74. Gorodetskiy A., Shlychkova A., Panov A.I. Delta Schema Network in Model-based Reinforcement Learning // Artificial General Intelligence. AGI 2020. Lecture Notes in Computer Science / ed. Goertzel B. et al. Springer. 2020.
75. Albus J.S., Barbera A. J. RCS: A cognitive architecture for intelligent multi-agent systems. Annual Reviews in Control. 2005. 29 (1). P.87-99.
76. Федунов Б.Е. «Электронный летчик»: «точка невозврата пройдена не будет». Бортовые оперативно советующие экспертные системы тактического уровня для пилотируемых летательных аппаратов // Авиапанорама: Международный авиационно-космический журнал. 2016. № 1. С. 9.
77. Федунов Б.Е. Интеллектуальные агенты в базах знаний бортовых оперативно советующих экспертных системах типовых ситуаций функционирования антропоцентрического объекта // Известия РАН. Теория и системы управления. 2019. № 6. С. 90-102.