ТК  СНТТ

 наступний  Технічний комітет стандартизації науково-технічної термінології

| Структура | Склад | Адреса | Засади | Правопис | Конференція | Семінар | Термінографія | Вісник | Товариство | Комісія | Оголошення | Хто є хто | Архів |


ЗБІРНИК

наукових праць учасників X Міжнародної наукової конференції

«Проблеми  української термінології СловоСвіт 2008»

30 вересня – 1 жовтня 2008 року


Кульчицький І. Технологічні аспекти вживання української мови в середовищі ОС Windows II / Ігор Кульчицький, Михайло Плеша // Проблеми української термінології : міжнар. наук. конф., 30 версн. − 1 жовт. 2008 р. : зб. наук. пр. ‒ Л., 2008. ‒ С. 100101.


        

УДК 004.4

 

Ігор Кульчицький1, Михайло Плеша2

1Львівський національний університет «Львівська політехніка»

2Львівська комерційна академія

 

Технологічні аспекти вживання української мови в середовищі ОС Windows II

 

© Кульчицький І., Плеша М., 2008

 

У статті розглянуто окремі аспекти використання україномовних текстів у середовищі останніх версій операційної системи Windows.

 

Some particular issues of using Ukrainian texts in the environment of latest versions of OS Windows have been studied and practical recommendations for avoiding difficulties have been suggested.

 

Не зважаючи на те, що сучасне програмне забезпечення дедалі повніше підтримує роботу з інформацією різними мовами, повноцінне функціювання у ньому української мови і надалі залишає бажати кращого. Ця стаття продовжує досліджувати проблематику використання україномовної інформації в комп’ютерах та комп’ютерних мережах, яку розпочато у [1]. Зазначимо, що публікація [1] викликала певне зацікавлення та обговорення (див., наприклад, http://hin.proz.com/forum/ukrainian/42593-D0%A3%D0%BA%D1%80%D0%B0%D1%97%D0%BD%D1%81%D1%8C%D0%BA %D0%B0_%D0%BA%D0%BB%D0%B0%D0%B2%D1%96%D0%B0%D1%82%D1%83%D1%80%D0%B0-.html), що і послужило причиною продовжити вивчення цієї теми, тим паче, що з часу написання попередньої статті відбулися певні зміни. Зокрема, офіційно вийшла на ринок нова версія операційної системи від фірми Microsoft, під назвою Windows Vista. Навколо цієї версії ОС Windows точиться багато розмов, про неї дають різноманітні відгуки. Нас же, в першу чергу, цікавлять проблеми описані в [1]. Приємно зазначити, що фірма Microsoft серйозно прислухається до побажань користувачів – у цю версію операційної системи внесено додаткову розкладку української клавіатури – Ukrainian (Enhanced). У цій розкладці, окремим символом винесено апостроф (він міститься на місці російської літери ё). Це вирішує зазначену в [1] проблему апострофа.

Далі, розглянемо дві цікаві проблеми, які доволі часто виникають у користувачів комп’ютера. На побутовому рівні вони звучать приблизно так:

1. Я копіюю текст з вікна програми у Word, а замість тексту вставляються знаки питання. У чому річ?

2. Я отримав(-ла) текст поштою, а в ньому беззмістовна абракадабра, що некоректно відображається у всіх кодуваннях. Що робити?

Перша проблема це досить цікавий аспект роботи багатьох програм, які розроблено в середовищі популярних компіляторів, таких, наприклад, як Borland Delphi, Microsoft Visual Studio. Якщо розробник програми спеціально не потурбувався про коректне формування буферу обміну інформації, то він (буфер) працює достатньо дивно і під час копіювання українського тексту (а, загалом кажучи, кириличного) може втрачати інформацію. Вирішення цієї проблеми досить просте. Достатньо, щоб під час копіювання з вікна тексту була активна українська (чи якась інша кирилична) розкладка клавіатури. Це створює певні незручності у використанні програм, але завадити цьому можна лише на стадії їхнього розроблення.

Друга проблема дещо ширша. Отримані некоректні тексти умовно можна розбити на три групи: 1) отримані суцільні знаки питання; 2) отримано текст, де невірно відображено певні українські літери (наприклад, «ї», «є»); 3) отриманий текст – нечитабельний набір кириличних символів. Перш ніж вдаватися до яких небуть порад, спробуємо проаналізувати чому так відбувається. Річ у тім, що в часи створення протоколів електронної пошти, за основу дуже недалекоглядно було взято семибітну таблицю кодування. Цього цілком достатньо для написання текстів латинськими літерами і цілком недостатньо для текстів іншими мовами, чи пересилання файлових вкладень. Для них сьогодні використовують спеціально розроблений механізм перекодування, що дає змогу обійтися семибітними кодами. З цим пов’язано ще один цікавий факт: саме з цих причин файл, владений у електронний лист, займає дещо більше місця, адже доводиться кожен байт інформації представляти через набір семибітних кодів. Отже проблема у тому, що для української мови (і для інших, що не на латинському алфавіті) з самого початку не було передбачено коректної роботи. Проблема поглиблюється тим, що Internet взагалі, і електронна пошта зокрема об’єднує користувачів, що працюють у різних операційних середовищах (Windows, UNIX, Linux, MacOS), а від так з різними таблицями кодування. Отже, якщо замість тексту електронною поштою прийшов лист, що містить суцільні знаки питання, то це означає, що текст втрачено на якомусь етапі пересилання (швидше всього на шляху між поштовим клієнтом та поштовим сервером). Врятувати інформацію вже не вдасться. Необхідно попросити автора надіслати листа ще раз й уважніше простежити за налаштуванням поштового клієнта, та кодуванням в якому формується лист. Можна також попросити надіслати листа з текстом, розміщеним у файлі, який прикріплено до листа.

Якщо отримано лист де некоректно відображено певні літери, то, власне кажучи, проблема не така вже й страшна – текст цілком читабельний і окрім певних незручностей інших неприємностей нема (хоча цього теж не повинно бути).

Якщо отримано лист з нечитабельним набором кириличних символів, то швидше за все, сервер неправильно розпізнав кодування листа і вирішив перекодувати його (і, можливо, дорогою цю процедуру повторили інші поштові сервери), після чого текст втратив читабельність. Відновити такий текст звичайно можна, навіть без підручних засобів та програм. Якщо текст відновлювати без додаткових програм, то доведеться провести частотний аналіз літер та замінити найчастіше вживані символи на найчастіші літери української мови (чи тієї, на якій написано лист) («о», «н», «а» і т.д.). Після цього необхідно провести лінгвістичний аналіз та відтворити текст. Така робота достатньо кропітка, тому значно зручніше скористатися спеціальними програмами. Найкращою для таких цілей (відновлення текстів із зіпсованим кодуванням) вважається програма під назвою «Штирлиц». Програму розроблено достатньо давно (на сьогодні припинив існування офіційний сайт програми http://www.shtirlitz.ru) проте достатньо легко справляється з поштовими листами, у яких зіпсоване кодування. Знайти програму можна за адресами: http://dl.softportal.com/load/shtirlitzIV.zip та http://softsearch.ru/programs/14-236-shtirlic-iv-download.shtml.

На завершення зазначимо, що комфортна робота користувача з поштою багато в чому залежить від поштового клієнта. І тут є що порекомендувати. Надзвичайну популярність на сьогоднішній день здобув поштовий клієнт під назвою ThunderBird. Це безкоштовний поштовий клієнт, що окрім іншого допускає українську локалізацію. Знайти його та почитати детальніше можна за адресою http://www.mozilla.org.

 

1. Кульчицький І. М., Плеша М. І. Технологічні аспекти вживання української мови в середовищі ОС Windows // Вісник нац. ун-ту «Львівська політехніка». Серія «Проблеми української термінології». – 2005. – № 538. – С. 112–115.

 

 

наверх Технічний комітет стандартизації науково-технічної термінології