Елде

Уикипедия енді сенуге болмайтын дәрежеге жетті

Жанат Ардақ

20.10.24, 09:04 10791

Ашық энциклопедия жасанды интеллект жазған фейктер мен сандырақтарға толып кетті.

Уикипедия енді сенуге болмайтын дәрежеге жетті

Фото: www.descopera.ro

Wikipedia бүгінде дағдарысты бастан өткеруде. Оны пайдаланушылар мәнсіз-мағынасыз, балдыр-батпақ, кейде тіпті шындыққа жанаспайтын, еш тексерілмейтін мақалаларды жаппай орналастыра бастады. Оларға мұндай мақалаларды жазуға ChatGPT сияқты чат-боттар, жасанды зерде көмектеседі. Бұл туралы Sauap.org ағартушылық порталы жазды.

ЖИ-технологиялар қарыштап дамыған заманда бұлай болатынын болжап білуге болатын еді. Проблеманың барын "Уикимедия Қоры" (Wikimedia Foundation, Inc.) коммерциялық емес ұйымы мойындады.

Түйткілді мәселенің шешімін табу үшін WikiProject AI Cleanup деп аталған жоба қолға алынды. Жоба аясында еріктілер тобы жасақталды. Олар генеративті ЖИ көмегімен қосылуы ықтимал жалған ақпараттарды табумен, редакциялаумен немесе жоюмен айналысады.

Жаһандық ашық энциклопедияны тазалаушы команданың негізін қалаушылардың бірі Ілияс Леблюдің (Ilyas Lebleu) айтуынша, бұл проблема кездейсоқ анықталған. Wikipedia-ның редакторлары мен пайдаланушылары бос сандыраққа ұқсас, чат-бот жазған мақалалардан цитаталарды байқап қалады.

Зерделей келе, күдік шындық болып шықты. Тұтас мақалалар немесе олардың бір бөліктері ChatGPT көмегімен түзілген.

"Біз хаттардың жазылуының әдеттегіден тыс, түсініксіздеу стиліне назар аудардық. Мұндайды саналы адам жазбайды. Ондай шатпақ мәтінді біз де ChatGPT көмегімен түзіп көрдік. Сол арқылы чат-ботқа тән сөздік орамдар мен тіркестерді айқындадық. Соның негізінде жасанды зерде генерациялаған барынша дөрекі, өрескел мысалдарды идентификацияладық. Осыдан кейін ЖИ-мәтіндерді іздеумен шұғылданатын жобаны ұйымдастыру туралы шешім қабылданды", – дейді Ілияс.

Ондай ЖИ-мәтіндердің бір мысалы мынадай: Уикипедияда "Эмберлисихар" (Amberlisihar) деп аталған, 1466 жылдары тұрғызылған Осман империясының қамалы туралы мақала орналастырылған. Шамамен 2 мың сөзден тұратын мәтінде сол байырғы шаһар-қамалдың орналасқан жері, оның құрылысы қалай жүргені бүге-шігесіне дейін суреттелген.

Алайда шынында ондай қамал өмірде болмаған. Ол туралы ақпарат толығымен ойдан шығарылған. Бірақ онда егжей-тегжейлерінің жазылуы арқасында текст сенімді көрінеді. Жасанды зерде мәтінді жай-жапсармен толықтыру үшін шынайы, тарихи фактілерді өз мақсатына пайдаланған, бұрмалаған.

Сорақысы сол, мұндай проблема Wikipedia-дағы тек жаңа мақалаларға ғана қатысты емес. Пранкшыл, әжуашыл, немесе ары таза емес пайдаланушылар жалған деректерді бұрыннан бар мақалаларға жаппай енгізіп, былықтырып жатқаны әшкереленді. Мысалы, биологтардың өздері сілтеме жасайтын қоңыздың сирек бір түрі туралы ғылыми мақалаға шаяндар түріне арналған бөлімнің цитаталарын қосып қойған. Тіпті еш ұялмастан, дереккөздерге дұрыс сілтемелерді қоса берген.

Леблю мен оның тобындағы әріптестері адамдардың мұндай сорақылыққа не үшін баратынын, не себепті соған уақытын, еңбегін еш ететінін түсінбейтінін айтады.

"Бірақ себептері белгілі. Оның бір себебі – Wikipedia-ның өз жүйесіндегі проблемалармен астасып жатыр. Ол кез келген адамға редакторға айналуға мүмкіндік береді. Айтпақшы, осыған байланысты көптеген университеттер өз студенттеріне ақпараттың негізгі дереккөзі ретінде Уикипедияны пайдалануына тыйым салып тастады. Екіншіден, былайғы жұрт та, жасанды интеллект те қазіргі кезде интернетті өз мүмкіндігін асыра, теріс пайдаланудың объектісіне айналдырды", – деп жазады Sauap.org.

Бүгінде жасанды интеллект Amazon Kindle-де кітаптар мен дипфейктерді жасауда қолданылады.

"ЖИ көмегімен жазылған контентті қасақана қосатын адамдар сол арқылы танымал болғысы келеді, көрнеу жалған, мистификациялық ақпаратты таратады. Салдарынан, фактчек жасамайтын адамдар ол контентті нақты, конструктивті деп ойлайды", – деді Леблю.

Бұл проблеманың республикамызға тікелей қатысы бар. Өзгелерінен айырмашылығы сол, Қазақстан Уикипедияны қаржыландырады. Ғылым және жоғары білім министрлігінің дерегінше, "Қазақстан Республикасында тіл саясатын дамытудың 2023-2029 жылдарға арналған тұжырымдамасының" 52-тармағы, атап айтқанда "Уикипедия ашық онлайн энциклопедиясын қазақ тіліндегі ғылыми мақалалармен, жарияланымдармен, еңбектермен және мәліметтермен толықтыру" жобасы жүзеге асырылады.

Осы мақсатта биыл тіпті еліміздің жоғары оқу орындары мен ғылыми институттардың ғалымдары мен ғылыми қызметкерлеріне арнап, семинарлар өткізілді. Оның барысында Уикипедия энциклопедиялық жобасына қазақ тілінде жан-жақты жетілдірілген, мазмұнға бай мақалалар енгізудің жолдары талқыланған. Оқушыларға, студенттерге, ізденушілерге ғылымның әртүрлі саласындағы маңызды деп саналатын энциклопедиялық білім қорын, әртүрлі жастағы азаматтардың ақпараттық қажеттіліктерін қазақ тілінде қамтамасыз ету мәселелері пысықталған.

"Уикипедия – қазіргі таңда интернеттегі ең ірі, әрі әйгілі энциклопедия. Бүгінде Уикипедияда әлемнің 285 тілінде 35 миллионнан астам мақала бар. Қазақ тілін ғылым тіліне айналдырудың бірден-бір жолы – ғылымның барлық саласындағы ақпаратты қазақ тілінде цифрландыру. Осы мақсатта Тіл саясаты комитеті тарапынан Уикипедия ашық энциклопедиясына енгізілген мақалалар көлеміне, мазмұнына, маңыздылығына мониторинг жұмыстары жүргізіледі", – делінген Саясат Нұрбектің ведомствосының хабарламасында.

2008 жылдан бері Уикипедияның белсенді авторы Қайыр Рысбаев Azattyq Rýhy-на сұхбатында онда жалған контент көп екенін жасырмады.

"2020 жылы Тәуелсіздіктің 20 жылдығына деп, ботпен Уикипедияға 100 мың мақала жариялады. Бізде көрсеткіш үшін, есеп үшін сан қуып кеткен, ботпен жазған кішкентай материалдар статистиканы көтеріп тұрады. Бірақ оның көпшілігі шала-пұла жазылған. Тіпті, кейбір материалдар бірнеше рет қайталанады. Сондай-ақ бір қатысушы Едігені, Жиренше шешен мен Алдаркөсені де найман етіп, тарихты бұрмалап жіберген. Одан бөлек, саясаткерлер мен оппозиционерлерге вандализм көп жасалады", – дейді Рысбаев.

Уикипедияда вандализммен күресу маңызды. Ресейде әрбір белгілі тұлғаның, бүкіл облыс губернаторларының, ірі саясаткерлерінің сондай "тұрақты нұсқасы" бекітіліп қойылған. Олай болмаса, "фейкометтар" келіп, неше түрліні ойдан құрастырып, жазып кетеді.