12 月 7 日,由 infoQ 主辦的 2018 ArchSummit 全球架構(gòu)師峰會(huì)在北京舉行。知乎合伙人、CTO 李大海受邀參會(huì)并發(fā)表主題演講,分享了知乎在內(nèi)容平臺(tái) AI 應(yīng)用的創(chuàng)新經(jīng)驗(yàn)。李大海表示,新內(nèi)容時(shí)代面臨信息過(guò)載及用戶內(nèi)容消費(fèi)升級(jí)兩大挑戰(zhàn),對(duì)于知乎來(lái)說(shuō),AI 算法技術(shù)創(chuàng)新和應(yīng)用則是應(yīng)對(duì)挑戰(zhàn)的關(guān)鍵武器。
以 AI 為武器,應(yīng)對(duì)信息雙重挑戰(zhàn)
李大海認(rèn)為,近幾年在移動(dòng)互聯(lián)網(wǎng)和科技驅(qū)動(dòng)下,內(nèi)容平臺(tái)迎來(lái)黃金時(shí)代。但也不可避免的,出現(xiàn)很多問(wèn)題和挑戰(zhàn),其中就包括:信息過(guò)載和用戶內(nèi)容消費(fèi)升級(jí)。
首先,技術(shù)的進(jìn)步讓信息豐富且實(shí)時(shí),也讓超負(fù)荷接收信息成為一種常態(tài)。根據(jù) IDC 預(yù)測(cè),全球數(shù)據(jù)總量預(yù)計(jì) 2020 年達(dá)到 44 ZB。信息大爆炸,讓人們花費(fèi)更多的精力接收和處理信息,沉淀知識(shí)。
與此同時(shí),用戶的內(nèi)容消費(fèi)升級(jí)正在發(fā)生。但優(yōu)質(zhì)、有用的信息一直是稀缺品,低質(zhì)、無(wú)用的信息卻很容易泛濫。如何大幅度提升優(yōu)質(zhì)內(nèi)容的絕對(duì)數(shù)量,擴(kuò)寬優(yōu)質(zhì)內(nèi)容的覆蓋領(lǐng)域,并同時(shí)減少低質(zhì)內(nèi)容的產(chǎn)生,是內(nèi)容平臺(tái)的共同難題。
面對(duì)信息過(guò)載及用戶內(nèi)容消費(fèi)升級(jí)兩大挑戰(zhàn),知乎一方面通過(guò)個(gè)性化推薦和搜索縮短用戶和內(nèi)容之間的距離,讓用戶在知乎擺脫信息過(guò)載帶來(lái)的負(fù)擔(dān)和壓力;另一方面從內(nèi)容生產(chǎn)和內(nèi)容治理等維度入手,加速優(yōu)質(zhì)的、稀缺內(nèi)容的生產(chǎn),壓縮低質(zhì)內(nèi)容的傳播空間。
在具體戰(zhàn)術(shù)上,知乎通過(guò)問(wèn)題路由技術(shù)實(shí)現(xiàn)了快速精準(zhǔn)匹配問(wèn)題與用戶,信息流個(gè)性化推薦技術(shù)則推動(dòng)了用戶便捷獲知感興趣的內(nèi)容,用戶推薦技術(shù)基于用戶興趣和行為數(shù)據(jù)強(qiáng)化用戶連接,瓦力算法機(jī)器人則通過(guò)識(shí)別不友善、低質(zhì)內(nèi)容,營(yíng)造良好社區(qū)氛圍。
連接用戶與內(nèi)容,打造 AI 驅(qū)動(dòng)的智能社區(qū)
知乎從問(wèn)答起步,經(jīng)過(guò) 8 年的發(fā)展,已經(jīng)成為一個(gè)綜合性全民知識(shí)內(nèi)容平臺(tái),涵蓋 25 萬(wàn)個(gè)話題,2700 萬(wàn)個(gè)問(wèn)題,1.2 億個(gè)回答,月瀏覽量達(dá)到 290 億。與此同時(shí),知乎也將技術(shù)創(chuàng)新納入核心戰(zhàn)略。據(jù)李大海介紹,自 2016 年引入機(jī)器學(xué)習(xí)開(kāi)始,知乎已經(jīng)將 AI 算法貫穿到知乎內(nèi)容與用戶的各個(gè)環(huán)節(jié)和體驗(yàn)中,構(gòu)建了“人與內(nèi)容”、“人與人”、“內(nèi)容與內(nèi)容”三個(gè)維度的連接。
在“人與內(nèi)容”的連接中,知乎做出了諸多嘗試。其中問(wèn)題路由上線之后,由系統(tǒng)推薦帶來(lái)的應(yīng)邀回答數(shù)比過(guò)去提升了 400%;采用 DNN 模型的知乎個(gè)性化推薦上線之后,知乎 Feed 流的人均閱讀量和人均使用時(shí)長(zhǎng)均增長(zhǎng)了 50% 以上;而瓦力算法機(jī)器人對(duì)不友善、低質(zhì)內(nèi)容的識(shí)別精準(zhǔn)度達(dá)到了 99.13%。這些技術(shù)應(yīng)用,在一定程度上為信息過(guò)載及用戶內(nèi)容消費(fèi)升級(jí)問(wèn)題的解決提供了可借鑒經(jīng)驗(yàn)。
知乎的技術(shù)還應(yīng)用在“人與人”的連接中。李大海表示,知乎在用戶連接方向的追求是“讓人發(fā)現(xiàn)更多有趣的靈魂”,本質(zhì)上是理解用戶價(jià)值觀、興趣,通過(guò)推薦,讓大家能在需要的時(shí)候找到最能解決自己?jiǎn)栴}的人,找到最有用的解答。據(jù)介紹,對(duì)于任何一個(gè)社區(qū)而言,用戶與用戶之間的連接是用戶活躍度和歸屬感的重要影響因素。在這個(gè)問(wèn)題上,知乎通過(guò) Graph Embedding 模型對(duì)用戶進(jìn)行隱式表示的學(xué)習(xí),計(jì)算出兩個(gè)用戶之間的親密度、興趣相似度,以此進(jìn)行更精準(zhǔn)的推薦,讓用戶更多地在社區(qū)里發(fā)生連接。
知乎社區(qū)內(nèi)“內(nèi)容與內(nèi)容”的連接主要集中在知識(shí)圖譜領(lǐng)域。知乎上的問(wèn)題和回答相當(dāng)于半結(jié)構(gòu)的文本組織,里面蘊(yùn)含了大量的有價(jià)值信息,但這些信息缺乏一個(gè)結(jié)構(gòu)化的整理,知乎希望通過(guò)構(gòu)建這樣一個(gè)知識(shí)圖譜,讓越來(lái)越多的提問(wèn)和回答中的有價(jià)值信息,能夠以一種更結(jié)構(gòu)化的形式表征出來(lái)。李大海透露,知乎目前構(gòu)建了以話題、實(shí)體為核心的百萬(wàn)級(jí)節(jié)點(diǎn)、千萬(wàn)級(jí)邊,構(gòu)建了話題相關(guān)性圖譜、話題上下位圖譜、話題與實(shí)體的關(guān)系圖譜等。并且知乎的知識(shí)圖譜已經(jīng)在首頁(yè)、推薦和搜索等實(shí)際業(yè)務(wù)中得到了應(yīng)用。
通過(guò)三大維度、多個(gè)領(lǐng)域的技術(shù)應(yīng)用嘗試,知乎讓每個(gè)用戶持有的信息都能高效地被發(fā)掘,每個(gè)用戶的內(nèi)容需求都能被快速地被發(fā)現(xiàn)并滿足,內(nèi)容的價(jià)值能在生產(chǎn)和流通中得到充分釋放,從而構(gòu)建一個(gè)由 AI 驅(qū)動(dòng)的“智能社區(qū)”,讓每個(gè)用戶都能高效獲得可信賴的解答。(一鳴)
免責(zé)聲明:本網(wǎng)轉(zhuǎn)載自其它媒體的文章,目的在于弘揚(yáng)科技創(chuàng)新精神,傳遞更多科技創(chuàng)新信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),在此我們謹(jǐn)向原作者和原媒體致以崇高敬意。如果您認(rèn)為本站文章侵犯了您的版權(quán),請(qǐng)與我們聯(lián)系,我們將第一時(shí)間刪除。