Во средата (1.4.2020) се одржа онлајн-работилница на ELLIS за примена на машинското учење во истражувањата за КОВИД–19. Европската лабораторија за учење и интелигентни системи (ELLIS) е организација што се труди полето на вештачката интелигенција во Европа да го направи многу попривлечно. Работилницата беше отворена и ја следеа многу научници, меѓу кои и Кирил Гаштеовски, докторанд на Универзитетот во Манхајм, кој работи како научен истражувач во лабораториите на NEC во Хајделберг, Германија. Тимот на „Наука за сите“ разговараше со него околу најважните работи претставени на работилницата.
Можеш ли да ни направиш едно резиме на конференцијата?
Работилницата беше организирана од лабораторијата ELLIS. Тие ја организираа својата прва онлајн работилница, која можеа да ја следат луѓе од целиот свет.
На работилницата имаше претежно експерти од областите на науката базирана на податоци (data science) и вештачката интелигенција и се зборуваше за тоа како можеме да ги имплементираме овие технологии за побрзо да стигнеме до некое ефикасно решение за забавување на заразата со коронавирусот, за откривање на лек, вакцина, итн. Исто така, дел од дискусијата беше и како да се мотивираат луѓето од овие области да придонесуваат доброволно во иницијативи на темата: на пример, зборуваше Деврет Риши од Kaggle, платформа каде што има натпревари за најдобри решенија за проблеми од науката базирана на податоци, а тука беше и Јошуа Бенџио од Универзитетот во Монтреал, кој е добитник на Тјуринговата награда за информатика и е рок-ѕвезда во областа на машинското учење и мислам дека тој најмногу придонесе конференцијата да добие на популарност. А и мене, реално, неговиот говор најмногу ми се допадна.
Работилницата требаше да се одржи како таква, па ја направиле онлајн или сега поради ситуацијата ја осмислиле и ја организирале?
Како што кажа Бернард Шолкопф на почетокот, за 1 април било планирано да имаат големо официјално отворање на ELLIS во „Royal Society of London“ – настан што го организирале со месеци. Но, поради глобалната пандемија со коронавирусот, настанот е откажан и решиле да го променат во онлајн-работилница за користење на машинско учење и вештачка интелигенција во борбата против COVID–19. Интересно е што целиот распоред, сите говори биле договорени во рок од една недела, што е навистина импресивно. Луѓето беа отворени за дискусија, имаше форма каде што можеа да се поставуваат прашања, имаше чет-прозорец каде што луѓето можеа да пишуваат сугестии за време на разговорот. Тоа што ме изненади е што траеше пократко отколку предвиденото, а не подолго, како што обично се случува со научните работилници и конференции. Некако сè беше поефикасно, иако немаше толкава организација.
Мене ова ми дава голем оптимизам за иднината на научните конференции, особено во поглед на инклузивноста и можноста за присуство на научници од средини со ограничени буџети. За неколку недели и конференцијата ICLR од областа на машинското учење ќе биде целосно онлајн. Таа е голема конференција, со илјадници учесници, кои сега имаат можност да ја следат онлајн за само околу 100 долари. Од ICLR имаа и блог-напис за тоа како ќе ја организираат конференцијата. На пример, сакаат да организираат неколку „соби за разговор“ (chat rooms) кои ќе бидат тематски сегментирани за да може да се задржи и социјалниот момент на конференцијата.
На конференцијата имаше и трудови или само пленарни предавања?
Само пленарни предавања, но бидејќи овие луѓе работат забрзано, имаат многу претпринтови што не се оценувани од други научници (peer review), но ги ставаат на „Aрхајв“ (arXiv.org) за да го споделат тоа што го имаат досега, затоа што знаеме дека денес со пандемијава тоа може да значи многу.
Интересно е како целава оваа криза го менува начинот на комуникација во науката, а верувам и дека во бизнисот е исто. Луѓето сега комуницираат поинаку бидејќи мораат, но мислам дека и по завршувањето на пандемијата физичкото присуство ќе биде значително намалено во многу научни и бизнис-процеси.
Многу ќе се смени, ама ќе се смени отпосле. Најчесто, науката ќе го види проблемот, ќе има години критичка дистанца и отпосле ќе каже – ова беше проблемот, вака се решаваше. Впечатокот е дека она до што ќе дојдат сега научниците, особено од областа на науката базирана на податоци, е нешто што ќе ни користи за следната пандемија по сто години, не за оваа.
Обично науката е бавен процес и јас не добив впечаток дека некои од луѓето на работилницата велат: „Ние ќе го решиме проблемот веднаш“. Сепак, добро беше што на работилницата имаше луѓе од различни профили, но сите со пристапи базирани на податоци. Како што кажа професорот Горазд Росоклија во една од минатите дискусии, ова е проблем што треба да се решава со мултидисциплинарни тимови. Светот е прекомплексен за да можат така лесно да се решаваат големи проблеми. На пример, Јошуа Бенџио истакна дека дури и да се дојде до конечно идеално решение на проблемот, ако тоа решение има сериозни проблеми со нарушување на приватноста, во Канада тоа веднаш ќе падне во вода поради очигледни етички причини, што ја наметнува потребата од имање правни експерти во тимот.
Имаше ли конкретни предлог-решенија за некои од проблемите во врска со кризата?
Еден предлог што мене многу ми се допадна е да се користи блутут-технологијата од телефоните, а не следење со GPS, што беше презентирано од Бенџио. Од техничка гледна точка, ако користите GPS, Wi-Fi или cell towers, прецизноста може и да не е толку добра, но ако користите блутут, прецизноста може да биде многу поголема. Ако јас и ти сме во близина и блутутот од нашите телефони е вклучен, може да се каже дали сме биле во доволно близок контакт (пример, помалку од 2 метра). Тогаш нашите телефони би генерирале некои рандом клучеви. Нашите телефони ќе си ги разменат меѓу себе овие рандом клучеви и ќе бидат достапни само од нашите телефони. Ако јас бидам позитивен на тестот за коронавирус, можам да пратам енкриптирана порака до тебе до и сите што биле во моја близина за да знаат дека веќе се изложени на ризик, но други би немале пристап до таа информација. Тоа би значело дека би можело да се заобиколи централистичкото гледање на податоците. На овој начин, ни операторите не мора да бидат вмешани (Слика 1).

Друг предлог што ми беше интересен е идејата на тимот на проф. Кјунгхјун Чо, кој сега работи на нов начин на дијагностицирање на коронавирусот. Идејата е да се истренираат алгоритми кои ќе ги идентификуваат пациентите со висок ризик уште пред да покажат симптоми. Претпоставката е дека уште пред да се покажат сериозни симптоми, кај пациентот може да се промени начинот на дишење, бидејќи болеста се развива во белите дробови. Врз основа на звуци од дишење (кои можат да се снимаат со паметен телефон), алгоритамот би можел да предвиди дали некој е заразен или не. Ова е многу интересен и (барем за мене) неинтуитивен начин да се искористи технологијата за тестирање во големи размери. Ако го направат тоа доволно ефикасно, секој човек што има телефон би можел да се тестира многу пати во текот на еден ден. Потоа, податоците и бенефитите што би ги добиле од тоа се неверојатно големи. Важно е да се напомене дека методологијата е сè уште во прелиминарна фаза на експериментирање сè уште и не знаеме дали е доволно добра.
Генерално, проблемот со вакви решенија е што има многу малку експерти од медицинските науки што се подготвени да бидат вклучени во процесот на развивањето на тие решенија. Иако има научници што работат на многу важни проблеми, како да нема да се случи транслацијата што е потребна за да ни помогне во справување со вирусот.
Беше предложена платформа од проф. Фред Хампрехт, која се вика Data Against Cоvid–19 (или во превод „Со податоци против КОВИД–19“, Слика 2). Ова е иницијатива на заедница од професионалци од областа на медицината, природните науки и науката базирана на податоци.

Тука можете едноставно да се пријавите како експерт и не донирате пари, туку донирате ресурс во форма на експертиза, crowdsourcing (повик кон интернет-корисниците заеднички да придонесат во решавањето на некој проблем преку натпревар или соработка) и сл. Имате четири опции: првата е ако сте лекар во европска клиника, можете да давате извештаи за локални случаи во еден заеднички формат на документи, што би намалило многу инженерски труд за некое решение во иднина; втората опција е ако имате прашања поврзани со КОВИД–19 или знаете некој што има; третата ако се занимавате со наука базирана на податоци и сакате да ја донирате вашата експертиза во форма на време, решавање на конкретни проблеми (задачи); и последната опција е да придонесете преку crowdsourcing. Според мене, добро би било министерствата да ги знаат овие иницијативи и цела Европа (па и пошироко) да дава извештаи тука, со што ќе имаме еден централизиран начин на известување за случаи, симптоми и ред други работи, од кои би можеле да се откријат некои шаблони за ширењето на болеста, предвидување на критични случаи, пресметка на ризик и сл.
Интересно е што во делот на секвенционирањето, кое делува како поле во голема мера водено од профит, уште на почетокот на појавата на вирусот во Кина, многу се работеше и јавно се споделуваа податоците, што го направи полето да делува навистина колаборативно.
Истото го зборуваа сите учесници на работилницата, дека ваков колаборативен труд навистина ретко се гледа. Многу научници оставија сè што прават во моментот и се фокусираа на ситуацијата со коронавирусот. Работата оди во таа насока луѓето несебично да споделуваат многу ресурси во моментов, многу повеќе отколку што се споделува во нормални околности.
Од искуството со доктори низ Европа, тешко може да се преброди разликата меѓу квантитативни и квалитативни истражувања. Во дел од медицинските науки квантитативните истражувања се прифатени и препорачливи и таму машинското учење добива на значење. Ама во голем дел од медицинските науки истражувањата се, пред сè, квалитативни и имаме сериозен проблем заедницата на медицински лица да ја видат и да ја прифатат можната придобивка од вештачката интелигенција. И второ, во медицинскиот свет многу се зборува за објаснива вештачка интелигенција (Explainable AI), односно давање објаснување за одлуката/заклучокот донесени со машинска интелигенција на начин прифатлив за таа заедница. Дали имаше некоја дискусија на овие теми?
За жал не, иако и Јошуа Бенџио многу работи на објаснива вештачка интелигенција, затоа што тоа е доста важна компонента. Докторите нема да донесат одлука само затоа што компјутер им вели да го направат тоа, без да им објасни зошто. Видов дека има „knowledge graph” (графикон на знаење наречен CovidGraph)“ за коронавирус што го развива група на научници и програмери. Идеално, ваква податочна структура би можела, на пример, да придонесе за да се дадат објаснувања за одлуката зошто да го испишеш пациентот од болница кога алгоритамот ти вели дека треба, а не е толку очигледно. Уште покритично сценарио би можело да биде доколку алгоритам предвиди дека не му треба веќе вентилација на пациент кој е сè уште на апарат за дишење. Од една страна, во време на пандемија од големи размери и ограничени ресурси, сакате да ги тргнете луѓето од апарати што е можно побрзо, за да може да го искористите истиот апарат на друг пациент. Од друга страна, погрешна одлука за предвремено исклучување на пациент од вентилатор може да го чини живот. Токму поради овие причини, за докторите би било исклучително важно да знаат зошто алгоритамот ја носи одлуката што ја дава како конечен резултат.
Факт е дека имаме многу повеќе податоци од која било претходна епидемија, ама колку податоците навистина можат со вештачка интелигенција да се стават во модел и да се користат за предвидување?
Поголемиот дел од работилницата се фокусираше на следењето со помош на технологијата, на развојот на лекови, предвидувањето на ризикот и здравствениот менаџмент. Еден од говорите беше конкретно за алатки на вештачка интелигенција со кои може да се помогне во управувањето во рамките на здравствениот систем. Болниците се преоптоварени, мораат да управуваат со ресурсите, а во екстремни ситуации, мораат и да носат одлуки кој ќе се стави на вентилатор, а кој ќе се остави да умре. Тоа се тешки одлуки, па затоа се бара начин тука технологијата да се стави во функција. На пример, да се предвиди ризикот за смртност на пациентот и врз основа на тоа полесно да се носат таквите тешки одлуки и со тоа би ја максимизирале колективната очекувана должина на животот (life expectancy).

Во делот на развојот на лекови, Гунтер Кламбауер кажа дека процесот инволвира селектирање од база на милиони соединенија кои се филтрираат на околу десетина илјади, па потоа на 250, па на 5, и на крајот да завршиме до едно соединение што е конечниот лек (Слика 3). Како што може да се види од Слика 3, ова е процес што трае со години. Машинското учење би можело значително да помогне во процесите на филтрирање на хемиските соединенија, што би го направиле целиот процес многу побрз.
БОНУС:
Историските документи покажуваат дека начинот на којшто се справуваме во оваа криза, и според мерките, и според реакциите на народот се копија од 1918 година. Колку новите технолошки алатки ќе помогнат крајот на кризата со КОВИД–19 да не биде ист како крајот на кризата со шпанскиот грип?
Кирил Гаштеовски: Јас сум голем оптимист кога станува збор за технологијата. Технологијата е важен параметар што секогаш ја менува играта. На пример, во 1918 година луѓето немале „Нетфликс“ и слични сервиси, немале онлајн-комуникација, не можеле да читаат вести од дома без да излезат надвор, немале таков исклучително лесен пристап до информациите како што имаме сега и како резултат на тоа, им било многу потешко да седат дома. Денес имаме огромен број на сервиси каде што може да се убие таа досада и веројатно тоа придонесува за олеснување на менталниот товар што го носиме што мораме да седиме дома, па наместо луѓето да можат да издржат две недели, сега можат да издржат два месеци. На кое било прашање, во која било област, денес сме неспоредливо подобри отколку пред сто години и не гледам зошто пандемијата би завршила исто, кога веќе сè оди подобро. Така што, мислам дека и овие сервиси (што помагаат луѓето полесно да се изолираат), користењето на технологија за постигнување на масовно тестирање, алатките за следење на контакти што би можеле да ги имаме – сето ова ќе придонесе да немаме толку жртви како во 1918 година. На пример, во моментов Тајван следи околу 55 000 граѓани во реално време што се во карантин и тоа е можеби една од главните причини зошто Тајван е една од земјите што се справуваат прилично успешно со корона-кризата, бидејќи бројот на вкупно заразени досега е само 355 случаи, а земјата има 24 милиони жители.
Кирил Зеленковски: Мислам дека сите податоци што се собираат се целосна утка. Можеби ќе користат за некој следен пат. Јас сум страшен песимист и мислам дека ќе биде исто како со шпанскиот грип. Која е логиката воопшто да се нема никаков глобален систем и секоја земја да презема различни мерки, сама да експериментира?! Што ако во сто години технологијата има отидено толку многу напред, кога ништо не може да се искористи за да се реши ситуацијава… Јас мислам дека светот оди на полошо. Моментално целата економија оди во рецесија. Во 1918 година тоа не било можно, немало таков раст за да може да се случи тоа. Денес има фирми што буквално пропаѓаат преку вечер. Мислам дека банкротот и економската криза на крајот ќе однесат повеќе жртви отколку самиот вирус.
Владимир Трајковиќ: И јас се сложувам дека сè ќе биде како што било во 1918, дека иако ќе имаме шанса да научиме нешто за следната епидемија, по десет години ќе заборавиме и повторно забавата ќе биде побитна и сè додека имаме филмски, спортски и музички ѕвезди што заработуваат повеќе од научниците, системот нема да биде побрз и поефикасен.
Никола Стиков: Делам дел од песимизмот, но мислам дека има една работа којашто навистина може да направи разлика и се сведува на тоа како технологијата што не е развиена за справување со пандемии може да се употреби, а тоа е следењето на податоци преку мобилните телефони. Ако јас знам во секој момент кој каде е, дали е заразен или не и со кого бил – тоа е моментот за кој еден ден ќе речеме: во 1918 немавме мобилни телефони, но во 2020 имавме. Според мене, тоа е технолошкиот момент што ја менува приказната. И масовното тестирање е напредок на технологијата и ако се покаже дека тоа е „лекот“, тогаш ќе кажам: да, навистина технологијата беше употребена навреме за да спречи експлозија. Лично, повеќе „ставам“ на следењето отколку на масовното тестирање, затоа што ми се чини дека вирусот прогресира толку брзо што сам прегорува.
Петар Кајевски: Како прво, ова е исклучителен вирус, каков што од 1918 досега немало за да споредуваме што сме правеле во меѓувреме. САРС-от е биолошки сличен вирус и многу од работите што се направени во Кина, Јапонија и Јужна Кореја како мерки за справување со коронавирусот денес се мерки директно произлезени од искуствата со САРС, што значи дека сепак учиме и моментот дека не напредуваме во тоа не е точен. Како второ, сметам дека целата ситуација ќе заврши со масовно тестирање. Тоа ќе стане реалност и техничка можност за неколку месеци и сите ќе преминат на таков вид на справување што гледам дека е единствениот реален модел со кој не доаѓа до колапс на економијата. Имаме среќа со коронавирусов што е релативно познат биолошки. Денешнава конференција на ELLIS беше многу добра бидејќи укажа дека огромен број работи што функционираат се работи што луѓето веќе ги вежбале. Од нештата што ни недостасуваат, што не сме ги научиле, е глобален систем за справување со какви било заразни работи. Сепак, за мене е позитивно тоа што разни земји испробуваат разни работи во ситуација кога не знаеме што функционира, а што не.
(Во дискусијата учествуваа: Кирил Гаштеовски, Никола Стиков, Владимир Трајковиќ, Петар Кајевски и Кирил Зеленковски.)