Вештачката интелигенција и обработката на природните јазици: до каде сме?

10.02.2022 11:29

Според анкета спроведена во 2018 година речиси половината од 150 лингвисти сметаат дека развојот на вештачката интелигенција наскоро ќе го намали обемот на работата на човечките преведувачи (Бен, 2018). Меѓутоа, од истражувањето произлегува друга, уште поинтересна информација: 38,2% од испитаниците не знаат ништо за развојот на технологијата што може да им ја олесни работата на преведувачите.

Поточно, авторите на истражувањето согледуваат дека во кругот на лингвистите и на преведувачите не постои вистинско разбирање на врската меѓу вештачката интелигенција, обработката на природните јазици и машинското преведување.

Во меѓувреме, за само неколку децении, машините што мислат навлегоа во секојдневието на човекот, за кого е предизвик да држи чекор со нивниот развој.

Пул, Mекворт, Гебел (1998: 2) повлекуваат паралела меѓу машините што мислат и машините што летаат (thinking machines and flying machines), поентирајќи дека во двата случаи е клучно разбирањето на принципите на летањето, односно на мислењето. Притоа, според нив, ако човек сака да ги разбере принципите на летањето, можни се два пристапа:

вниманието да се сврти кон летањето како што се појавува во природата, да се проучат организмите што природно можат да летаат и да се имитира нивната физиономија и
да се разберат принципите на летањето без ограничување на неговата појава во природата.

Така, најпознат приврзаник на првиот принцип бил Икар, а вториот принцип овозможува создавање артефакти што ги отелотворуваат горенаведените принципи (Пул, Мекворт и Гебел, 1998: 3), без да се однесуваат како птици, лилјаци или инсекти. Единственото што им е заеднично е способноста да летаат. Пример за ова, велат авторите, се авионите.

Ако се примени оваа аналогија врз интелигенцијата, станува збор за обид да се разберат нејзините основни принципи и да се применат за да се создадат интелигентни артефакти, кои во основа не ги имитираат човечките суштества. Единственото што им е заедничко е способноста да мислат.

Според ова, прашањето „Можат ли компјутерите навистина да мислат?“ треба да се разгледува исто како прашањето „Можат ли авионите навистина да летаат?“

Поимот вештачка интелигенција

Во својот предлог за организирање летен проект за изучување на вештачката интелигенција на семинарот во Дартмут, Мекарти уште во 1955 година нагласил еден од најзначајните принципи на ВИ: „Секој аспект на учењето или која било друга карактеристика на интелигенцијата може во принцип да се опише толку прецизно што е можно да се создаде машина што ќе ги симулира“ (Мекарти, 2006: 12). Конференцијата на Мекарти и на неговите колеги во 1956 година се смета за зародиш на проучувањето на ВИ (Кнап, 2007).

Една од идеите на Мекарти претставени во предлогот се однесува конкретно на обработката на природните јазици, имено идејата дека човечките мисли се преточуваат во говор така што зборовите се поставуваат во сооднос според некои правила на расудување (rules of reasoning). Со помош на тие правила може да се создаде низа реченици, во кои секоја реченица имплицира други и обратно (Мекарти, 2006: 14).

Чарниjак и Мекдермот (1987: 6) ја дефинираат вештачката интелигенција како проучување ментални способности со помош на компјутерски модели, кои ги имитираат пред сѐ менталните способности на „обичните луѓе“, како сетилото за вид и усвојувањето на природните јазици. При тоа, машините учат да прават нешта во кои луѓето засега се подобри: иако луѓето без попреченост го прифаќаат човечкото сетило за вид како нешто само по себе подразбирливо, за да може една машинада гледа, потребни се неколку милиони пресметки (ибид.). Тоа значи дека способностите што на човекот му изгледаат лесни, се всушност доста компликувани, а оттаму произлегува дека ако машината треба да научи да имитира човечка ментална способност, од тој процес на учење може да се научи многу за таа ментална способност кај луѓето. Чарниjак и Мекдермот (ибид.) го нарекуваат ова „централната догма на ВИ“: човечкиот мозок до одредена мера функционира како компјутер. Иако вештачката интелигенција го проучува однесувањето поврзано со интелигенцијата, таа не е обврзана (ниту пак може!) целосно да ги имитира методите на човечкиот мозок, но ја следи неговата структура и дава резултати.

Овој принцип е исклучително важен кога станува збор за обработка на природните јазици.

Вештачки невронски мрежи

Вештачките невронски мрежи го добиле името по аналогија на мрежата од неврони во човечкиот мозок (Реј, Бек, 2018: 4). Со оваа аналогија меѓу првите се занимавале МекКалок и Питс уште во 1943 година, кога го објавиле својот формален модел на невронот.

Реј и Бек разграничуваат две големи подрачја на кои се употребуваат вештачките невронски мрежи, и тоа:

вештачки невронски мрежи што се моделираат со цел да се разберат човечкото однесување и искуство, поточно функционирањето на човечкиот мозок и
вештачки невронски мрежи со конкретна практична примена на полето на статистиката, економијата, техниката и слично.

За обработката на природните јазици од интерес е секако првиот вид.

Кога станува збор за градбата на вештачките невронски мрежи, како и на оние во човечкиот мозок, и тие се составени од неврони, наречени уште единици или јазли. (Реј, Бек, 2018: 5).

Јазлите се делат на три групи во зависност од тоа дали ја примаат или ја пренесуваат дразбата (видоизменета), или, пак, ги изнесуваат на виделина резултатите.

Процесот на учење започнува со таканаречената фаза на тренирање (Реј, Бек, 2018: 11), во која се претставува материјалот и се применува конкретното правило на учење. Учењето може да се одвива со и без надзор; во првиот случај се внесуваат и низа решенија, имено двојки од проблеми и решенија, кои на системот му помагаат преку индукција да најде сопствени решенија во слични примери. При учењето без надзор се внесува само материјалот што треба да се совлада.

Во фазата на тестирање се проверува до какви решенија доаѓа невронската мрежа ако ѝ се зададат нови дразби.

Типичен пример од нашето секојдневие во кое се среќаваме со вештачки невронски мрежи, се т. н. CAPTCHA (Completely Automated Public Turing Test to Tell Computers and Humans Apart – ‘сосема автоматизиран јавен Тјурингов тест за да се прави разлика меѓу компјутери и луѓе’).

Во овие тестови често треба да ги пронајдеме сите слики што содржат одреден предмет (на пример, мост, како на Слика 1) или да одгатнеме збор што е испишан на необичен начин, со екстремно закосени или искривени букви.

Еден од главните принципи на овој тест доаѓа од гешталт-психологијата и гласи дека луѓето можат да ја препознаат целата слика од само еден нејзин дел додека машините не можат (Лук, 2003). Ако го примениме ова на конкретната слика од левата страна, сликата најдолу лево претставува мост сликан оддолу, а не странично, како што е вообичаено и како што е сликан мостот даден за пример најгоре.

Понатаму, ако го споредиме дадениот пример со процесот на учење на вештачките невронски мрежи опишан погоре, еден компјутер би можел да научи да препознава мост преку процес на учење со надзор, каде што би добил огромен број фотографии на мостови со упатство „ова е мост“ и огромен број фотографии што не прикажуваат мостови со упатство „ова не е мост“. Со други зборови, машината не може да воспостави арбитрарна врска меѓу зборот „мост“ и предметот од надворешнојазичната реалност во стилот на Де Сосир и би била многу збунета кога би се нашла на изложба на Душамп.

Обработка на природните јазици: Џи-Пи-Ти-2

Вештачките невронски мрежи што се од посебен интерес при обработката на природните јазици се таканаречените рекурентни вештачки невронски мрежи (recursive neural networks, RNN), на кои во фазата на учење им се дава огромен текст врз чија основа треба да ја пресметаат веројатноста на дистрибуцијата на одреден знак во низата (Карпати, 2015). Потоа, во фазата на тестирање, машината создава нов текст, надоврзувајќи знак по знак Карпати ги наведува како пример собраните дела на Шекспир компримирани во датотека од 4.4 мегабајти, која ѝ се дава на мрежата како материјал за учење. По неколку часа работа, мрежата научила да ги форматира резултатите како драма и да произведува сопствени драмски монолози. Следното ниво на тежина, според Карпати, се кохерентни прозни текстови на научни теми во стил на статиите на Википедија. Материјалот за учење во овој случај се состоел од 100 мегабајти вакви текстови и невронската мрежа научила да пишува сопствени статии имитирајќи го неутралниот прозен стил, па дури и измислувајќи сопствени интернет-врски како извори (врските не водат никаде, но според структурата се сосема коректни) и учејќи како точно да отвора и да затвора загради.

Од особен интерес за овој труд е новиот генератор на текст на Опен- Еј-Ај, Џи-Пи-Ти-2, кој го усовршил прозниот стил на пишување статии без притоа навистина да разбира за што пишува (Хорниголд, 2019).

За разлика од претходните опити со релативно мал обем на текст, Џи-Пи-Ти-2 добил 40 гигабајти текст за тренирање, количество што одговара на 35.000 примероци од романот Моби Дик (Херн, 2019). Кога потоа во фазата на тестирање добила пасус напишан од човек во кој станува збор за еднорози што можат да зборуваат со задача да го комплетира, вештачката невронска мрежа напишала уште девет пасуса, односно целосна новинарска статија, измислувајќи го дури и името на научникот што наводно ги пронашол еднорозите (д-р Перез). Во текстот нема логички контрадикции ниту граматички грешки, структурата е иста како кај кој било просечен новинарски текст. Статијата објавена од Опен-Еј-Ај е целосно преземена во прилогот (в.д.).

Кај оваа вештачка невронска мрежа најмногу изненадуваат две функции за кои првобитно не била експлицитно програмирана, а кои ги извршува интуитивно, таканаречени новостекнати вештини, “emergent skills” (Хорниголд, 2019):

Во изворниот текст што ѝ бил даден на невронската мрежа имало долги пасуси под кои стоела кратенката TL;DR (too long, didn’t read, ‘предолго, не прочитав’), која стандардно се употребува пред накратко да се сумира долг текст. Кога во Џи-Пи-Ти-2 ја задале кратенката TL;DR, мрежата се обидела да го сумира текстот што го напишала претходно.
Во изворниот текст се наоѓале и двојазични реченици: истиот краток текст напишан на англиски и на француски. Кога мрежата добила наредба да преведе текст од англиски на француски, резултатот бил оценет со 11.5 BLEU1. За споредба, најдобриот машински преведувач моментно е оценет со 33.5 BLEU, но преводот од Џи-Пи-Ти-2 е подобар од оној на многу вештачки невронски мрежи програмирани токму за преведување. Најмногу изненадува тоа што невронската мрежа Џи-Пи- Ти-2 успеала да ја развие оваа вештина само со вкупно 10 мегабајти текст на француски, т. е. со петстотини пати помал корпус на француски јазик од тој што обично им се задава на вештачките невронски мрежи што се тренираат за преведување (Редфорд и др., 2018: 7).

Импликации

Хорниголд (2019) ги оценува способностите на Џи-Пи-Ти-2 да извлече од внесениот текст структура и логика како „неочекувани и возбудливи“. Самите автори на оригиналната статија во која се претставуваат наодите по експериментирањето со оваа вештачка невронска мрежа заклучуваат дека до гореопишаните резултати дошло поради обемот и разновидноста на материјалот што бил зададен (Редфорд и др., 2018: 10).

Оригиналната невронска мрежа Џи-Пи-Ти-2 нема да биде достапна за јавноста во целост бидејќи претставниците на Опен-Еј-Ај што работеле на проектот се плашат од „злоупотреба на технологијата“ (ибид.)

Секоја претставена функција на оваа вештачка невронска мрежа би можела да се злоупотреби, на пример за пишување лажни вести или лажни рецензии на книги, филмови или производи, што би можело да има несогледливи последици за економијата.

Најинтересни се, секако, интуитивните и индуктивните способности на овој модел, за науката толку „неочекувани и возбудливи“. Во иднина би биле од корист студии во кои процесот на учење (а не само резултатите) би се споредувал со тој на други вештачки невронски мрежи и со тој на луѓето.

На крајот, иако изгледа дека авторите на невронската мрежа Џи-Пи- Ти-2 се свесни за нејзиниот потенцијал, па затоа одбиваат да го споделат со јавноста, тешко е да се анализира моделот подетално бидејќи сѐ што имаме се резултати избрани од самите автори. Сепак, појавата на толку напредна вештачка невронска мрежа отвора важни етички прашања што треба да се истражат, по можност пред евентуално да го направи следниот голем чекор во правец на технолошка сингуларност.

Извор: „Како си ми“ студентска филолошка конференција, 2020