ТК СНТТ |
| Структура | Склад | Адреса | Засади | Правопис | Конференція | Семінар | Термінографія | Вісник | Товариство | Комісія | Оголошення | Хто є хто | Архів |
ЗБІРНИК
наукових праць учасників XVIII Науково-практичної онлайн-конференції СловоСвіт 2024
«Проблеми української термінології»
3–5 жовтня 2024 р.
Зубченко В. Стандартизація термінології генеративного штучного інтелекту // Проблеми української термінології : зб. наук. праць XVIII Наук.-практ. конф. (м. Львів, 3–5 жовт. 2024 р.). Львів, 2024. С. 78‒80.
Володимир Зубченко
Київський національний університет імені Тараса Шевченка
Стандартизація термінології генеративного штучного інтелекту
© Зубченко В. П., 2024
Заналізовано тренди розвитку технологій штучного інтелекту. Запропоновано, обговорити проблеми побудови та стандартування термінології в царині генеративного штучного інтелекту.
Ключові слова: українська мова, генеративний штучний інтелект, наука про дані, машинне навчання.
1. Суть проблеми
Українськомовна термінологія в галузі генеративного штучного інтелекту стикнулася з низкою викликів через швидкі темпи розвитку технологій і переважну англійськомовність першоджерел. Один із найбільших викликів полягає в своєчасному перекладі та адаптації нових термінів. Часто трапляється, що новітні концепції та інновації виникають і їх закріпляють спочатку англійською мовою, що своєю чергою ускладнює їхнє своєчасне й адекватне впровадження в українську мову.
Другий виклик стосується однозначности та зрозумілости перекладених термінів. Частина термінів, які перекладають на українську мову, можуть мати різні тлумачення або ж фахівці їх не сприймають одностайно. Це призводить до неоднорідности вживання термінів у різних професійних середовищах, що ускладнює комунікацію та розуміння між професіоналами.
Третя проблема пов’язана з потребою створити та зберегти власну термінологічну базу, яка б відповідала сучасним технологічним реаліям і культурово-лінгвістичним особливостям української мови. Технологічний поступ потребує повсякчасного оновлення та вдосконалення термінології, а також розроблювання нових термінів, їх стандартування та популяризацію серед широкого кола користувачів. Це потребує зусиль з боку наукових установ, лінгвістів і співпраці з міжнародними колегами для досягання єдности щодо вживання термінології.
2. Аналіз останніх досліджень і публікацій
Генеративний штучний інтелект (ШІ) належить до класу ШІ-систем, які можуть створювати новий контент, дані або ідеї, подібні до тих, які могла би створити людина [1]. Ці системи використовують моделі машинного навчання, зокрема методи глибинного навчання (deep learning), такі як генеративні змагальні мережі (GANs), варіаційні автокодери (VAEs) й моделі на основі трансформерів, такі як GPT-3 [2].
Генеративний ШІ може генерувати різноманітні вихідні дані, а також текст, написання статей, історій або віршів, створювати реалістичні фотографій, художні роботи або дизайни, композицію мелодій або повні треки, генерувати програмний код на основі конкретних завдань або вимог, а також створювати тривимірні об’єкти або середовища. Генеративний ШІ задіюють у численних застосовних завданнях – від створення контенту й дизайну до вдосконалювання наукових досліджень і завтоматизації складних завдань [3].
Метою статті є добір україномовних аналогів для термінології генеративного штучного інтелекту. Прикладами стандартування термінології в царині генеративного штучного інтелекту є такі терміни:
- Генеративний штучний інтелект (Generative AI): однозначне вживання цього терміна для опису моделей, які створюють новий контент (текст, зображення, музику).
- Трансформер (Transformer): узгоджений термін для опису конкретної архітектури нейронних мереж, що вживають для опрацювання послідовностей даних.
- Велика мовна модель (Large Language Model): стандартування цього терміна для позначення моделей, що опрацьовують та генерують людську мову на високому рівні.
- Дипфейк (Deepfake): вживання єдиного терміна, щоб описувати методи, які задіюють штучний інтелект для створювання підроблених, але реалістичних відеоматеріалів.
- Чат-бот (Chatbot): однозначний термін для програм, що імітують діалог із користувачем за допомогою тексту або голосу.
- Розмова людина-бот (Human-Bot Interaction): узгоджене визначання процесу комунікації між людиною та чат-ботом.
- Навчання з підкріпленням (Reinforcement Learning): устандартований термін, щоб описувати тип машинного навчання, де модель навчають, взаємодіячи з середовищем.
- Генеративно-змагальна мережа (Generative Adversarial Network, GAN): уживання єдиного терміна для моделей, що мають дві нейронних мережі: генератор і дискримінатор.
- Неперервне навчання (Continual Learning): уживання цього терміна, щоб описувати процес, за якого нейронна мережа навчається новим завданням, зберігаючи воднораз знання з попередніх завдань.
- Промпт (Prompt): однозначне вживання цього терміна, щоб описувати введення, яке подають генеративній моделі для формування відповіді або генерації контенту.
3. Виклад основного матеріялу
Добір україномовних аналогів для термінології генеративного штучного інтелекту є важливим із кількох стрижневих причин. По-перше, це сприяє розвиткові наукової та технічної мови, що дає змогу українським дослідникам і розробникам ефективно спілкуватися та співпрацювати на національному рівні. По-друге, уживання українськомовних термінів робить нові технології та знання доступнішими для широкої громадськості, а також студентів й освітян. Це підвищує рівень технічної грамотности й залученість громадян до сучасних технологій. По-третє, це підтримує культурову й мовну ідентичність країни, зберігаючи її унікальність і незалежність від зовнішніх впливів. Урешті-решт, упроваджування україномовних термінів допомагає створити єдину термінологічну базу, що полегшує інтеграцію українських розробок у міжнародні проекти та стандарти.
Пропонуємо вживати такі українськомовні аналоги чужоземним термінам у царині генеративного штучного інтелекту:
трансформер – перетворювач;
генеративний штучний інтелект – створювальний штучний інтелект;
дипфейк-відео – глибокопідроблене відео;
чат-бот – розмовний помічник;
віртуальний асистент – цифровий помічник;
промпт – запит;
copilot – співпілот;
гейміфікація – ігрофікація;
темплейт – шаблон.
Розширювати цей список – надважливе завдання для поліпшення чистоти української мови.
Висновки
Стандартування термінології в царині генеративного штучного інтелекту є надзвичайно важливе, оскільки воно вможливлює чітке комунікування та спільне розуміння між дослідниками, розробниками й користувачами цієї технології. Узгоджена термінологія сприяє точності й послідовності у вживанні термінів, полегшує обмін знаннями та досвідом, а також мінімізує ризик непорозумінь і помилок, які можуть виникати через різні інтерпретації неузгоджених термінів. Це, своєю чергою, дає змогу прискорити науковий і технологічний поступ, підвищує ефективність співпраці між різними учасниками процесу та сприяє інтеґрації новітніх досягнень на міжнародному рівні. Крім того, устандартована термінологія вможливлює легший доступ до навчальних матеріалів і ресурсів, підтримуючи освітнє готування нових фахівців у цій галузі. Це також сприяє підвищенню якости й конкурентоспроможности національних розробок на світовому ринку технологій штучного інтелекту.
1. Foster, D. (2019). Generative Deep Learning : Teaching Machines to Paint, Write, Compose, and Play. O’Reilly Media. 327 p. 2. Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press. 773 p. 3. Langr, J., & Bok, V. (2019). GANs in Action : Deep learning with Generative Adversarial Networks. Manning Publications. 240 p.