IT之家3月30日消息 企查查 App 顯示,近日,騰訊科技(深圳)有限公司公開了一項名為 “挖掘用戶職業(yè)的方法、裝置、計算機可讀存儲介質(zhì)和終端設(shè)備”的專利授權(quán),公開號 CN110110213B,申請日期為 2018 年 1 月。
IT之家了解到,專利說明顯示,現(xiàn)有技術(shù)在挖掘用戶的信息時,往往是基于用戶個人的文本類數(shù)據(jù)進行,但這種方式存在極大的缺陷,其主要原因在于這種處理方式過于依賴自然語言處理技術(shù)。然而,理解自然語言,尤其是互聯(lián)網(wǎng)上常見的短文本,需要大量的背景知識和上下文信息。在缺乏這些信息的情形下,即使是人工也無法準確理解文本的含義,目前的很多計算機算法對文本含義的識別效率和準確率也同樣不理想。
例如,社交類應(yīng)用的用戶過社交類應(yīng)用發(fā)出一條包含 “福田”的短語,由于 “福田”既可以指深圳的福田區(qū),又可以指 “福田汽車”,在缺乏上下文信息的情形下,現(xiàn)有的挖掘用戶的信息方法無法判斷這個發(fā)出包含 “福田”的短語的用戶只是居住在深圳福田區(qū)的一位普通市民 (例如,退休在家的大媽或大爺),還是福田汽車 4S 店的一位銷售人員。
綜上,現(xiàn)有的挖掘用戶的信息,例如,職業(yè)信息的方法召回率和準確率都偏低,無法滿足大數(shù)據(jù)時代人們對信息準確獲取的要求。
本發(fā)明屬于機器學(xué)習(xí)領(lǐng)域,提供了一種挖掘用戶職業(yè)的方法、裝置、計算機可讀存儲介質(zhì)和終端設(shè)備,以精確預(yù)測用戶的職業(yè)類型。
本發(fā)明提供的技術(shù)方案一方面使得待挖掘用戶與職業(yè)標簽?zāi)軌蚓_匹配;另一方面,在將待挖掘用戶的嵌入向量與職業(yè)標簽嵌入向量相匹配時,無需大量計算資源,計算速度極快。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。