Control Systems and Computers, N3, 2024, Стаття 5

Levchuk V.Yu. The Universal Module for Integration of an Intelligent Assistant into iOS Applications. Сontrol Systems and Computers. 2024. № 3. C.  

УДК 514.18 

В.Ю. Левчук, магістр, Національний університет “Києво-Могилянська академія”, вул. Григорія Сковороди, 2, м. Київ, Україна, 04070, ORCID: https://orcid.org/0009-0001-6613-7478, pifagor6541@gmail.com

УНІВЕРСАЛЬНИЙ МОДУЛЬ ІНТЕГРАЦІЇ ІНТЕЛЕКТУАЛЬНОГО ПОМІЧНИКА У ЗАСТОСУНКИ iOS

Вступ. Інтеграція інтелектуальних помічників у мобільні додатки стала важливою задачею в сучасному світі, де користувачі дедалі більше використовують технології штучного інтелекту для все більшої кількості задач. Сучасні рішення, такі як Siri, Google Assistant і Amazon Alexa, пропонують обмежену гнучкість та потребують значних ресурсів для розробки. Це обмежує можливості широкого впровадження їх, особливо у невеликих розробницьких командах. Тому існує потреба у створенні універсального та ефективного модуля для інтеграції інтелектуальних помічників.

Мета статті. Метою цієї роботи є розробка універсального модуля інтеграції інтелектуального помічника, який може бути легко впроваджений у будь-які iOS-додатки. Модуль повинен бути автономним, мати мінімальні вимоги до ресурсів і спрощувати процес розробки.

Методи. Проаналізовано сучасні реалізації інтеграції інтелектуальних помічників зі сторонніми додатками та виокремлено головні недоліки. Сформовано критерії до універсальної інтеграції інтелектуального помічника та визначено підхід до інтеграції як розширення доступності. Розроблено програмний модуль, який надає функціонал інтелектуального помічника для інтеграції в додатки iOS із мінімальними витратами ресурсів. Використано моделі-трансформери природньої мови з бібліотеки HuggingFace. Для тестування створено фоторедактор для iOS, у який було інтегровано розроблений модуль і який має інтерфейс англійською та українською мовами.

Результати. Розроблено програмний модуль, який дозволяє повне керування застосунком за допомогою голосових запитів та має простий прикладний програмний інтерфейс для інтеграції у довільний iOS застосунок. Для інтеграції використано новий підхід, який полягає у привʼязуванні контекстних дій до елементів інтерфейсу та дозволяє інтелектуальному помічнику працювати з усім додатком. Інтелектуальний помічник всередині модуля не залежить від інтернет-зʼєднання, не потребує попереднього тренування та забезпечує однакову якість роботи незалежно від сфери діяльності додатку. Найвища якість роботи забезпечується для англійської мови через обмеження використаних моделей-трансформерів природньої мови.  Реалізований модуль дає змогу знизити затрати на розробку, підвищити продуктивність і забезпечити високу якість взаємодії з користувачем.

Висновки. Розвиток технологій штучного інтелекту та апаратного обладнання сьогодні дає змогу широко використовувати можливості ШІ на обмежених потужностях мобільних пристроїв. Розроблений універсальний модуль інтеграції інтелектуального помічника демонструє сучасні можливості інтеграції з мінімальними потребами у ресурсах. Він є гнучким, ефективним і може бути легко впроваджений у широкий спектр мобільних додатків. Матеріали статті будуть корисними для розробників, які шукають способи покращення функціональності своїх додатків за допомогою інтелектуальних помічників, а також для дослідження покращення структури взаємодії помічників та застосунків.

Завантажити повний текст! (англійською)

Ключові слова: інтелектуальний помічник, штучний інтелект, семантичний пошук, природна мова, модель, машинне навчання, розпізнавання мовлення, графічний інтерфейс.

  1. Nori, H. et al. (2023). “Capabilities of GPT-4 on medical challenge problems”. [online]. Available at: <https://arxiv.org/abs/2303.13375> [Accessed April 21, 2024].
  2. Yang, H., Lee, H. (2019). “Understanding user behavior of virtual personal assistant devices”. Inf. Syst. E-Bus Manage, 17, pp. 65-87. DOI: https://doi.org/10.1007/s10257-018-0375-1.
  3. Hoy, M. B. (2018). “Alexa, Siri, Cortana, and More: An Introduction to Voice Assistants”. Medical Reference Services Quarterly, 37 (1), pp. 81-88. https://doi.org/10.1080/02763869.2018.1404391.
  4. Easwara Moorthy, A. and Vu, K.-P.L. (2015). “Privacy Concerns for Use of Voice Activated Personal Assistant in the Public Space”, International Journal of Human-Computer Interaction, 31(4), pp. 307-335. DOI: https://doi.org/10.1080/10447318.2014.986642.
  5. Vaswani, A. et al. (2023). “ Attention is all you need”, arXiv.org. [online]. Available at: <https://arxiv.org/abs/1706.03762> [Accessed April 28, 2024].
  6. ZachNagengast – ZachNagengast/similarity-search-kit. [online]. Available at: <https://github.com/ZachNagengast/similarity-search-kit> [Accessed 11 May 2024].
  7. Wolf, Thomas, et al. “HuggingFace’s Transformers: State-of-The-Art Natural Language Processing”. ArXiv:1910.03771 [Cs], Feb. 11. 2020, arxiv.org/abs/1910.03771 [Accessed May 13, 2024].
  8. 8. Sanh, V., Debut, L., Chaumond, J., & Wolf, T. (2019).” DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter”. arXiv.org. https://arxiv.org/abs/1910.01108 [Accessed May 13, 2024].
  9. 9. Wang, W. et al. (2020). “MINILM: Deep Self-Attention Distillation for Task-Agnostic Compression of Pre-Trained Transformers”. https://arxiv.org/abs/2002.10957 [Accessed June 21, 2024].

Received 28.07.2024