ТК  СНТТ

 наступний  Технічний комітет стандартизації науково-технічної термінології

| Структура | Склад | Адреса | Засади | Правопис | Конференція | Семінар | Термінографія | Вісник | Товариство | Комісія | Оголошення | Хто є хто | Архів |


ВІСНИК

Національного університету «Львівська політехніка»

«ПРОБЛЕМИ УКРАЇНСЬКОЇ ТЕРМІНОЛОГІЇ»

№ 869


Партико З. Автоматизація визначення функцій і продуктивності термінів у терміносистемах / Зіновій Партико // Вісник Нац. ун-ту «Львівська політехніка». Серія «Проблеми української термінології». 2017. 869. С. 47–49.


     

УДК 001.4’82:519.170.2:303.66

 

Зіновій Партико

Національний Університет «Львівська політехніка»

 

АВТОМАТИЗАЦІЯ ВИЗНАЧЕННЯ ФУНКЦІЙ І ПРОДУКТИВНОСТІ ТЕРМІНІВ У ТЕРМІНОСИСТЕМАХ

 

© Партико З. В., 2017

 

Сутність проблеми полягає в складності аналізу терміносистем великого обсягу, що містять сотні чи тисячі термінів. Щоб розв’язати цю проблему доцільно використати метод сітьового* аналізу, запропонований Е. Ф. Скороходьком. Метод передбачає подання терміносистеми у формі матриці, виокремивши початкові, похідні й кінцеві терміни, а також визначивши їхню продуктивність. За умови коректного представлення у словнику вихідних даних (тобто відповідно до прийнятого формату) метод може бути доволі просто автоматизовано. Подано приклад формату розробленого словника, а також способи його формалізованого аналізу.

Ключові слова: українська мова, терміносистема, сітьовий аналіз, автоматизація, словник

 

The essence of the problem is the complexity of the analysis of large-scale terminology systems containing hundreds or thousands of terms. To solve this problem it is suggested to use the method of network analysis proposed by E. F. Skorohodko. The method involves the representation of the terminology system in the form of a matrix and the separation of the initial, derivative and final terms, as well as the definition of their productivity. Given the correct representation in the dictionary of output data (that is, according to the accepted format), the method can be quite simply automated. An example is given of the format of the developed dictionary, as well as methods of its formalized analysis.

Keywords: Ukrainian language, terminology systems, network analysis, automation, dictionary

 

Сутність проблеми. Сутність досліджуваної проблеми полягає в тому, що, укладаючи традиційними методами терміносистеми, зазвичай важко визначити, продуктивність термінів у ній, а, отже, встановити функції цих термінів.

Аналіз останніх досліджень і публікацій. Існує низка відомих традиційних методів, які дають змогу визначати продуктивність і функції термінів у терміносистемах, проте такі методи передбачають ручні операції, а тому охоплюють унаслідок цього порівняно невелику кількість (кілька десятків, сотню) термінів. На такі дослідження витрачають значний час.

Українським дослідником Е. Ф. Скороходьком свого часу було запропоновано сітьовий метод дослідження продуктивності й функцій термінів у терміносистемах, який ґрунтується на моделюванні терміносистеми за допомогою орієнтованого графа [3; 4]. Уважаємо, що такий метод (за умови коректного представлення вихідних даних) дає змогу якісно описати аналізовану терміносистему й провести її якісний аналіз.

Виокремлення нерозв’язаних раніше частин загальної проблеми. Нерозв’язана раніше частина проблеми полягає в тому, що вказаний сітьовий аналіз терміносистем не було автоматизовано. Автоматизація цього методу може дати змогу отримати значний ефект під час аналізу терміносистем, а також отримати в процесі його проведення об’єктивні дані, до того ж за будь-якої величини терміносистеми.

Формулювання мети статті. Мета статті полягає, по-перше, у тому, щоб показати способи формалізації методу сітьового аналізу терміносистем, а, по-друге, у спробі організувати створення для цього під егідою Технічного комітету стандартизації науково-технічної термінології відповідних програмних засобів.

Виклад основного матеріалу дослідження. Як відомо, у терміносистемі кожен термін виконує певні функції, а також залежно від цього має певну продуктивність. Тут під функціями маємо на увазі те, яким він є:

– початковим (у його означенні нема жодного заголовкового терміна укладеної терміносистеми, але його використовують в означеннях інших термінів цієї терміносистеми);

– похідним (він має в означенні заголовкові терміни цієї терміносистеми і його використовують в означеннях інших термінів),

 кінцевим (він має в означенні заголовкові терміни терміносистеми, але в означеннях інших термінів його не використовують).

Продуктивність указує, у скількох означеннях (в абсолютних одиницях чи відсотках) було використано певний термін. Дані про функції та продуктивність термінів дають змогу ефективніше конструювати створювані терміносистеми (виявляти терміни, що стоять поза межами терміносистеми; виявляти групи не взаємопов’язаних термінів; серед термінів-синонімів виявляти найменш продуктивні тощо). Тобто, такі дані дають змогу перетворювати термінологію (неупорядковану множину термінів) на терміносистему.

Укладаючи термінологічні словники, для визначення функцій і продуктивності термінів доцільно використовувати таку технологію:

1.  Підготувати термінологічний словник за допомогою текстового редактора у форматі doc, rtf тощо. Кожен запис такого словника повинен мати заголовковий термін та його означення (розділювачем, як це традиційно є в словниках, може бути тире).

Передбачається, що означення термінів повинні відповідати вимогам формальної логіки до означень [1, с. 165–175].

2.  В означеннях термінів у ручному режимі треба виокремлювати шрифтом (товстим, курсивом, підкресленням тощо) ті терміни, які в цьому словнику використовують як заголовкові.

3.  За допомогою будь-якої програми для роботи з електронними таблицями, наприклад Exel, збудувати матрицю N × N , де N – кількість заголовкових термінів у словнику. У такій таблиці рядки будуть задавати заголовкові терміни, а стовпці – ті терміни, які використовують у їхніх означеннях.

4.  На перехресті рядків і стовпців у комірках указати, в означеннях яких термінів є інші заголовкові терміни. Цю операцію можна виконувати як у ручному, так і в автоматизованому режимах.

Щоб виконати цю операцію в автоматизованому режимі для ідентифікування термінів на їхні закінчення треба накладати маски (зазвичай, на три знаки)1.

Для автоматизованого виконання цієї операції потрібно розробити спеціальні програмні засоби. Складність створення таких засобів відповідає складності дипломної роботи для магістрів, що навчаються за однією зі спеціальностей напряму «Програмування».

5.  Вирахувати, які терміни є початковими, похідними, кінцевими, а також їхню продуктивність (функції та продуктивність можуть бути представлені у формі таблиці, в якій в алфавітному порядку для кожного терміна вказано ці його характеристики).

6.  За допомогою наявних пакетів програм, призначених для візуалізації даних, представити отримані результати у формі сітьового графа.

У рамках викладеної технології (п. 1 і 2) нами було укладено словник видавничих термінів [2] фрагмент якого подаємо (курсивом в означеннях виокремлено терміни, які в цьому словномку зутрічаються як заголовкові):

Видання – 1. Окреме самостійне повідомлення чи їх множина, які ЗМІ: а) відредагували, сконструювали й зафіксували методами друкування, тиснення на папері чи копіювання на електронні або цифрові носії інформації; б) доповнили вихідними відомостями; в) опублікували/оприлюднили чи планують до опублікування/оприлюднення. 2. Поліграфічна одиниця видання найвищого рівня, яка складається з розділів, доповнена вихідними відомостями і становить окрему самостійну одиницю видавничої продукції.

Повідомлення інформація, зафіксована на носії інформації, яку відправник інформації (зокрема автор, журналіст) призначає для передачі іншій людині чи групі людей – отримувачам (реципієнтам, тобто читачам, слухачам, глядачам). Вербальні повідомлення інваріантні щодо мови. Фіксуючи повідомлення конкретною мовою, автор перетворює його в текст. Види: вербальні (словесні) й невербальні (наприклад, графічні, аудіальні, відео).

Інформація – розпізнаний кібернетичною системою (людиною) сигнал (чи комплекс сигналів – образ), який змінює її стан, зменшуючи кількість варіантів вибору нею чергової дії (команди).

Укладена видавнича терміносистема містить понад 800 заголовкових термінів. Проте подальші дослідження цієї терміносистеми загальмовано через відсутність згаданих вище програмних засобів.

Висновки й перспективи подальших досліджень. Ураховуючи викладене, уважаємо за доцільне ініціювати в рамках НУ «Львівська політехніка» під егідою Технічного комітету стандартизації науково-технічної термінології створення згаданих раніше програмних засобів, які могли б стати корисними для дослідження терміносистем української мови в нашій державі. Такі програмні засоби, доцільно було б поширювати на безоплатній основі.

 

1. Конверський А. Є. Логіка (традиційна та сучасна) : підручник / А. Є. Конверський. – К. : Центр навчальної літератури, 2004. – 536 с. 2. Партико З. В. Словник видавничих термінів / З. В. Партико. – Запоріжжя : КПУ, 2013. – 68 с. 3. Скороходько Э. Ф. Семантические сети и автоматическая обработка текста / Э. Ф. Скороходько. К. : Наук. думка, 1983. – 218 с. 4. Скороходько Е. Ф. Термін у науковому тексті (до створення терміноцентричної теорії наукового дискурсу) / Е. Ф. Скороходько. – К. : Логос, 2006. – 98 с.

 


*  мережевого (тут і далі треба вживати цей термін) ред.

1  Для автоматизованого виконання цієї операції потрібно розробити спеціальні програмові засоби. Складність створення таких засобів відповідає складності дипломної праці для магістрів, що навчаються за однією зі спеціальностей напряму «Програмування».

 

 

наверх Технічний комітет стандартизації науково-технічної термінології