Control Systems and Computers

Control Systems and Computers, N2, 2023, Стаття 5

https://doi.org/10.15407/csc.2023.03.054

Dvoichenkov D.D. Knowledge Graphs And Large Language Models. Control Systems and Computers. 2023. № 3. С. 54-60.

УДК 004.912

Dvoichenkov D.D., аспірант, Міжнародний науково-навчальний центр інформаційних технологій та систем НАН та МОН України, просп. Глушкова, 40, Київ 03187, Україна, ORCID: https://orcid.org/0009-0007-1935-6743, E–mail: supersokol777@gmail.com

Графи знань і великі мовні моделі

Вступ. Великі мовні моделі (ВММ), засновані на архітектурі Transformer, на сьогодні є одними з найбільш широко використовуваних інструментів у галузі обробки природної мови. Проте цей підхід має певні обмеження та недоліки. Зокрема, ці проблеми стають критичними для експертних систем, заснованих на NLP. ВММ іноді можуть генерувати помилкові та ненадійні відповіді. У цій роботі ми обстоюємо використання структурованих графів знань для вирішення цієї проблеми.

Мета. Основна мета статті – дослідити взаємозв’язок між ВММ та структурованими графами знань, а також висвітлити, як Графи Знань можуть допомогти вирішити проблеми, пов’язані з ВММ, зокрема у експертних системах. Ми аргументуємо, що поєднання експресивної сили ВММ зі структурою знань графів може забезпечити більш надійні та контекстуально точні відповіді.

Методи. Розглянуто інструментарій побудови графів знань та великих мовних моделей.

Результати. Детально розглянуто синергетичний зв’язок між великими мовними моделями LLM і графами знань KGs. Показано, що використання KG може подолати властиві обмеження LLM та підвищити їх продуктивність у задачах обробки природної мови. Встановлено вплив архітектури Transformer на різні завдання обробки природньої мови. LLMs мають великі можливості розуміння природної мови. Однак вони також мають деякі вразливі місця, такі як галюцинації, упередження, природа чорної скриньки, залежність від мови та високі вимоги до ресурсів. Ці обмеження стають особливо проблематичними в експертних системах на основі обробки природної мови, де точність і надійність інформації мають вирішальне значення.

Висновки. В результати проведеного дослідження зроблено висновок, що запропонована інтеграція LLM з KG може призводити до більш надійних, точних і справедливих рішень обробки природної мови, але створити та підтримувати такі комбіновані системи досить нелегко. У майбутніх дослідженнях планується розробити нові стратегії для кращого та надійнішого створення KG-текстів.

Завантажити повний текст! (англійською)

Ключові слова: графи знань, великі мовні моделі, експертні системи, обробка природної мови.

Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A.N., Kaiser, L. Polosukhin, I. (2017). Attention is all you need. Advances in neural information processing systems, 30. https://doi.org/10.48550/arXiv.1706.03762.
Chung, J.J.Y., Kamar, E., Amershi, S. (2023). Increasing Diversity While Maintaining Accuracy: Text Data Generation with Large Language Models and Human Interventions. In Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics , Vol. 1: Long Papers, pp. 575–593, Toronto, Canada. https://doi.org/18653/v1/2023.acl-long.34.
Zhang, W., Deng, Y., Liu, B., Pan, S. J., & Bing, L. (2023). Sentiment Analysis in the Era of Large Language Models: A Reality Check. https://doi.org/10.48550/arXiv.2305.15005.
Moslem, Y., Haque, R., Way, A. (2023). Adaptive machine translation with large language models. https://doi.org/10.48550/arXiv.2301.13294
Yao, B., Jiang, M., Yang, D., & Hu, J. (2023). Empowering LLM-based Machine Translation with Cultural Awareness. https://doi.org/10.48550/arXiv.2305.14328
Zhu, W., Liu, H., Dong, Q., Xu, J., Huang, S., Kong, L., Chen, J., Li, L. (2023). Multilingual machine translation with large language models: Empirical results and analysis. https://doi.org/10.48550/arXiv.2304.04675
Wu, Y., Jia, F., Zhang, S., Li, H., Zhu, E., Wang, Y., Lee Y.T., Peng R., Wu, Q., Wang, C. (2023). An Empirical Study on Challenging Math Problem Solving with GPT-4. https://doi.org/10.48550/arXiv.2306.01337
Poldrack, R. A., Lu, T., & Beguš, G. (2023). AI-assisted coding: Experiments with GPT-4.
https://doi.org/10.48550/arXiv.2304.13187
Maus, N., Chao, P., Wong, E., & Gardner, J. R. (2023, August). Black box adversarial prompting for foundation models. In The Second Workshop on New Frontiers in Adversarial Machine Learning. [online]. Available at: <https://openreview.net/forum?id=aI5QPjTRbS > [Accessed: 23 Sept. 2023].
Zhao, W. X., Zhou, K., Li, J., Tang, T., Wang, X., Hou, Y., Min, Y., Zhang, B., Zhang, J., Dong, Z., Du, Y., Yang, Ch., Chen, Y., Chen, Zh., Jiang, J., Ren, R., Li, Y., Tang, X., Liu, Z., Liu, P., Nie, J.-Y., Wen, J.R. (2023). A survey of large language models. https://doi.org/10.48550/arXiv.2303.18223
Kaddour, J., Harris, J., Mozes, M., Bradley, H., Raileanu, R., McHardy, R. (2023). Challenges and applications of large language models. arXiv preprint arXiv:2307.10169. https://doi.org/10.48550/arXiv.2307.10169
Singhal, K., Tu, T., Gottweis, J., Sayres, R., Wulczyn, E., Hou, L., Clark, K., Pfohl, S., Cole-Lewis, H., Neal, D., Schaekermann, M., Wang, A., Amin, M., Lachgar, S., Mansfield, Ph., Prakash, S., Green, B., Dominowska, E., Arcas, B.A., Tomasev, N., Liu, Y., Semturs, Ch., Mahdavi, S.S., Barral, J., Webster, D., Corrado, G.S., Matias, Y., Azizi, Sh., Karthikesalingam, A., Natarajan, V. (2023). Towards expert-level medical question answering with large language models. https://doi.org/10.48550/arXiv.2305.09617
Choudhary, N., Reddy, C. K. (2023). Complex Logical Reasoning over Knowledge Graphs using Large Language Models. https://doi.org/10.48550/arXiv.2305.01157
Pan, S., Luo, L., Wang, Y., Chen, C., Wang, J., & Wu, X. (2023). Unifying Large Language Models and Knowledge Graphs: A Roadmap. https://doi.org/10.48550/arXiv.2306.08302
Hogan, A., Blomqvist, E., Cochez, M., d’Amato, C., Melo, G. D., Gutierrez, C., Gayo, J.E.L., Kirrane, S., Neumaier, S., Neumaier, A., Navigli, R., Schmelzeisen, L., Sequeda, J., Staab, S., Zimmermann, A. (2021). Knowledge graphs. ACM Computing Surveys (Csur), 54(4), pp. 1-37. https://doi.org/10.1145/3447772

Надійшла 21.09.2023

Control Systems and Computers

Контакти