ТК  СНТТ

 наступний  Технічний комітет стандартизації науково-технічної термінології

| Структура | Склад | Адреса | Засади | Правопис | Конференція | Семінар | Термінографія | Вісник | Товариство | Комісія | Оголошення | Хто є хто | Архів |


ЗБІРНИК

наукових праць учасників XVIII Науково-практичної онлайн-конференції СловоСвіт 2024

«Проблеми української термінології»

35 жовтня 2024 р.


Зубченко В. Стандартизація термінології генеративного штучного інтелекту // Проблеми української термінології : зб. наук. праць XVIII Наук.-практ. конф. (м. Львів, 3–5 жовт. 2024 р.). Львів, 2024. С. 7880.


      

УДК 001.4

Володимир Зубченко

Київський національний університет імені Тараса Шевченка

 

Стандартизація термінології генеративного штучного інтелекту

 

© Зубченко В. П., 2024

Заналізовано тренди розвитку технологій штучного інтелекту. Запропоновано, обговорити проблеми побудови та стандартування термінології в царині генеративного штучного інтелекту.

Ключові слова: українська мова, генеративний штучний інтелект, наука про дані, машинне навчання.

 

1. Суть проблеми

Українськомовна термінологія в галузі генеративного штучного інтелекту стикнулася з низкою викликів через швидкі темпи розвитку технологій і переважну англійськомовність першоджерел. Один із найбільших викликів полягає в своєчасному перекладі та адаптації нових термінів. Часто трапляється, що новітні концепції та інновації виникають і їх закріпляють спочатку англійською мовою, що своєю чергою ускладнює їхнє своєчасне й адекватне впровадження в українську мову.

Другий виклик стосується однозначности та зрозумілости перекладених термінів. Частина термінів, які перекладають на українську мову, можуть мати різні тлумачення або ж фахівці їх не сприймають одностайно. Це призводить до неоднорідности вживання термінів у різних професійних середовищах, що ускладнює комунікацію та розуміння між професіоналами.

Третя проблема пов’язана з потребою створити та зберегти власну термінологічну базу, яка б відповідала сучасним технологічним реаліям і культурово-лінгвістичним особливостям української мови. Технологічний поступ потребує повсякчасного оновлення та вдосконалення термінології, а також розроблювання нових термінів, їх стандартування та популяризацію серед широкого кола користувачів. Це потребує зусиль з боку наукових установ, лінгвістів і співпраці з міжнародними колегами для досягання єдности щодо вживання термінології.

 

2. Аналіз останніх досліджень і публікацій

Генеративний штучний інтелект (ШІ) належить до класу ШІ-систем, які можуть створювати новий контент, дані або ідеї, подібні до тих, які могла би створити людина [1]. Ці системи використовують моделі машинного навчання, зокрема методи глибинного навчання (deep learning), такі як генеративні змагальні мережі (GANs), варіаційні автокодери (VAEs) й моделі на основі трансформерів, такі як GPT-3 [2].

Генеративний ШІ може генерувати різноманітні вихідні дані, а також текст, написання статей, історій або віршів, створювати реалістичні фотографій, художні роботи або дизайни, композицію мелодій або повні треки, генерувати програмний код на основі конкретних завдань або вимог, а також створювати тривимірні об’єкти або середовища. Генеративний ШІ задіюють у численних застосовних завданнях – від створення контенту й дизайну до вдосконалювання наукових досліджень і завтоматизації складних завдань [3].

Метою статті є добір україномовних аналогів для термінології генеративного штучного інтелекту. Прикладами стандартування термінології в царині генеративного штучного інтелекту є такі терміни:

Генеративний штучний інтелект (Generative AI): однозначне вживання цього терміна для опису моделей, які створюють новий контент (текст, зображення, музику).

Трансформер (Transformer): узгоджений термін для опису конкретної архітектури нейронних мереж, що вживають для опрацювання послідовностей даних.

-  Велика мовна модель (Large Language Model): стандартування цього терміна для позначення моделей, що опрацьовують та генерують людську мову на високому рівні.

Дипфейк (Deepfake): вживання єдиного терміна, щоб описувати методи, які задіюють штучний інтелект для створювання підроблених, але реалістичних відеоматеріалів.

Чат-бот (Chatbot): однозначний термін для програм, що імітують діалог із користувачем за допомогою тексту або голосу.

Розмова людина-бот (Human-Bot Interaction): узгоджене визначання процесу комунікації між людиною та чат-ботом.

-  Навчання з підкріпленням (Reinforcement Learning): устандартований термін, щоб описувати тип машинного навчання, де модель навчають, взаємодіячи з середовищем.

Генеративно-змагальна мережа (Generative Adversarial Network, GAN): уживання єдиного терміна для моделей, що мають дві нейронних мережі: генератор і дискримінатор.

-  Неперервне навчання (Continual Learning): уживання цього терміна, щоб описувати процес, за якого нейронна мережа навчається новим завданням, зберігаючи воднораз знання з попередніх завдань.

Промпт (Prompt): однозначне вживання цього терміна, щоб описувати введення, яке подають генеративній моделі для формування відповіді або генерації контенту.

 

3. Виклад основного матеріялу

Добір україномовних аналогів для термінології генеративного штучного інтелекту є важливим із кількох стрижневих причин. По-перше, це сприяє розвиткові наукової та технічної мови, що дає змогу українським дослідникам і розробникам ефективно спілкуватися та співпрацювати на національному рівні. По-друге, уживання українськомовних термінів робить нові технології та знання доступнішими для широкої громадськості, а також студентів й освітян. Це підвищує рівень технічної грамотности й залученість громадян до сучасних технологій. По-третє, це підтримує культурову й мовну ідентичність країни, зберігаючи її унікальність і незалежність від зовнішніх впливів. Урешті-решт, упроваджування україномовних термінів допомагає створити єдину термінологічну базу, що полегшує інтеграцію українських розробок у міжнародні проекти та стандарти.

Пропонуємо вживати такі українськомовні аналоги чужоземним термінам у царині генеративного штучного інтелекту:

трансформер    перетворювач;

генеративний штучний інтелект  –  створювальний штучний інтелект;

дипфейк-відео    глибокопідроблене відео;

чат-бот    розмовний помічник;

віртуальний асистент    цифровий помічник;

промпт    запит;

copilot    співпілот;

гейміфікація    ігрофікація;

темплейт    шаблон.

Розширювати цей список – надважливе завдання для поліпшення чистоти української мови.

 

Висновки

Стандартування термінології в царині генеративного штучного інтелекту є надзвичайно важливе, оскільки воно вможливлює чітке комунікування та спільне розуміння між дослідниками, розробниками й користувачами цієї технології. Узгоджена термінологія сприяє точності й послідовності у вживанні термінів, полегшує обмін знаннями та досвідом, а також мінімізує ризик непорозумінь і помилок, які можуть виникати через різні інтерпретації неузгоджених термінів. Це, своєю чергою, дає змогу прискорити науковий і технологічний поступ, підвищує ефективність співпраці між різними учасниками процесу та сприяє інтеґрації новітніх досягнень на міжнародному рівні. Крім того, устандартована термінологія вможливлює легший доступ до навчальних матеріалів і ресурсів, підтримуючи освітнє готування нових фахівців у цій галузі. Це також сприяє підвищенню якости й конкурентоспроможности національних розробок на світовому ринку технологій штучного інтелекту.

 

1. Foster, D. (2019). Generative Deep Learning : Teaching Machines to Paint, Write, Compose, and Play. O’Reilly Media. 327 p. 2. Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press. 773 p. 3. Langr, J., & Bok, V. (2019). GANs in Action : Deep learning with Generative Adversarial Networks. Manning Publications. 240 p.

 

 

наверх Технічний комітет стандартизації науково-технічної термінології