科技日?qǐng)?bào)北京8月23日電(記者張夢(mèng)然)人工智能的“遺忘”與人類不同,這也是該領(lǐng)域面臨的一大挑戰(zhàn)。據(jù)《連線》雜志網(wǎng)站近日消息稱,作為計(jì)算機(jī)科學(xué)中的新興領(lǐng)域,機(jī)器學(xué)習(xí)研究者們已經(jīng)開始探索在AI中誘發(fā)“選擇性失憶”的方法,其目標(biāo)是在不影響模型性能的前提下,從機(jī)器學(xué)習(xí)中刪除特定人員或點(diǎn)的敏感數(shù)據(jù)。如果未來(lái)能夠?qū)崿F(xiàn),那么這一概念將幫助人們更好地控制數(shù)據(jù)。
機(jī)器學(xué)習(xí)宗旨是使用計(jì)算機(jī)作為工具并致力于真實(shí)、實(shí)時(shí)的模擬人類學(xué)習(xí)方式,其可以將現(xiàn)有內(nèi)容進(jìn)行知識(shí)結(jié)構(gòu)劃分,再?gòu)V泛應(yīng)用于解決工程應(yīng)用和科學(xué)領(lǐng)域的復(fù)雜問題。現(xiàn)在,機(jī)器學(xué)習(xí)被視作最具智能特征的研究領(lǐng)域,但科學(xué)家已經(jīng)提出了新的問題:機(jī)器會(huì)學(xué)習(xí),但它會(huì)遺忘嗎?實(shí)際上,它們的學(xué)習(xí)方式雖然在效仿人類,但“遺忘”方式卻與我們大不一樣。
機(jī)器學(xué)習(xí)的“遺忘”,對(duì)于有需求的用戶,也就是那些對(duì)他們?cè)诰W(wǎng)上分享的內(nèi)容感到后悔的人來(lái)說(shuō),其實(shí)很直觀。但從技術(shù)層面來(lái)講,消除特定數(shù)據(jù)點(diǎn)影響的傳統(tǒng)方法,是“從零開始”重建系統(tǒng),這是一項(xiàng)代價(jià)可能相當(dāng)高昂的工作,令企業(yè)幾乎難以承受。具體來(lái)說(shuō),某些地區(qū)的用戶如果他們對(duì)披露的內(nèi)容改變了主意,其實(shí)是有權(quán)要求公司刪除他們的數(shù)據(jù)的。但徹底抹除這件事很難實(shí)現(xiàn),因?yàn)橐坏┙?jīng)過(guò)訓(xùn)練,機(jī)器學(xué)習(xí)系統(tǒng)就不會(huì)輕易改變,甚至就連訓(xùn)練者們自己,也不清楚系統(tǒng)是如何掌握這些能力的,因?yàn)樗麄儾⒉荒芡耆斫庾约赫{(diào)試或訓(xùn)練出的算法。
2019年有科學(xué)家提出可以將機(jī)器學(xué)習(xí)項(xiàng)目的源數(shù)據(jù)分成多個(gè)部分,以實(shí)現(xiàn)對(duì)單個(gè)數(shù)據(jù)點(diǎn)的“遺忘”,但最近已被證明存在缺陷。如果提交的刪除請(qǐng)求以特定的順序出現(xiàn),無(wú)論是偶然的還是惡意的,機(jī)器學(xué)習(xí)系統(tǒng)都會(huì)崩潰。因此,要實(shí)現(xiàn)“選擇性失憶”這個(gè)概念,科學(xué)家可能需要在計(jì)算機(jī)科學(xué)方面做出全新探索。
“當(dāng)他們(用戶)要求刪除數(shù)據(jù)時(shí),我們能否消除他們數(shù)據(jù)的所有影響,同時(shí)避免從頭開始重新訓(xùn)練的全部成本?”賓夕法尼亞大學(xué)機(jī)器學(xué)習(xí)教授亞倫·羅斯表示,他們目前進(jìn)行的研究就是希望能找到一些“中間地帶”。或許在不久的將來(lái),有望找出一條既可以控制數(shù)據(jù)也可以保護(hù)由數(shù)據(jù)產(chǎn)生的價(jià)值的發(fā)展道路。
免責(zé)聲明:本網(wǎng)轉(zhuǎn)載自其它媒體的文章,目的在于弘揚(yáng)科技創(chuàng)新精神,傳遞更多科技創(chuàng)新信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),在此我們謹(jǐn)向原作者和原媒體致以敬意。如果您認(rèn)為本站文章侵犯了您的版權(quán),請(qǐng)與我們聯(lián)系,我們將第一時(shí)間刪除。