百度框計算中的需求分析概述
發布時間:2011-07-07 點擊次數:
圖1 “非誠勿擾”的框計算結果
需求分析是框計算的入口,因為只有分析出query的需求,才能更好地展現出相應的結果來滿足用戶的需求。因此對query的需求分析得越準確、覆蓋的query準多,用戶的滿意度則越大。需求分析是框計算中最重要也是難度最大的地方之一。
識別query的需求,最容易想到的方法是查詞表。比如將所有的電影、電視劇名都事先收集起來,放到詞表中,只要用戶輸入該詞表中的詞,就能識別出一個query是否有尋找視頻的需求。這種方法的優點是快,但缺點非常明顯:首先,這種方法只能將query劃分為2個維度,要么有視頻需求,要么沒有視頻需求。但很多視頻的名字,具有多方面的含義,在視頻上面只是其中一個微弱的含義,如果直接出視頻需求,則會極大地傷害用戶。比如,有一個廣告片的名字叫“百度一下”,這個廣告片可能60%以上的用戶都不熟悉,如果這60%以上的用戶輸入“百度一下”,直接給出一個名為“百度一下”的視頻觀看結果,則這60%以上的用戶會感覺非常困惑。其次,這種方法不能很好地滿足大部分用戶的需求。用戶在尋找視頻時,表述方法是多種多樣的,比如:士兵突擊全集、士兵突擊 高清、士兵突擊全集在線觀看等,這3個query都具有強烈的尋找視頻需求,但通過查表的方法,卻無法識別出該需求。再次,這種方法對電影、電視劇外的視頻需求無法滿足。有視頻需求的往往不止電影、電視劇,流行或新聞時效性的很多東西,都具有強烈的視頻需求。比如:西單女孩、中關村男孩、釣魚島撞船、朝韓炮擊等,多數用戶往往都有查看相關視頻的需求。最后,這種方法缺乏預測性,識別出的query數量有限。即對于詞表中的詞條,能夠識別出視頻需求,但詞表外詞條,無法識別出視頻需求。因此,如果詞表的規模為N,則最多只能識別出N個query具有視頻需求。
從上面的分析中,我們可以總結出,一個好的需求分析方法,至少要滿足如下需求:1)具有很高的準確率以及召回率,即能在識別出90%以上query需求的同時,又能保證識別出來的需求,95%以上都是正確無誤的;2)具有良好的預測能力,即能夠準確地預測出未知query的需求;3)具有識別需求與解析字段功能,即在識別出query需求的同時,還能高效地從中解析出所需信息。
下面是幾個典型的例子。通過這些例子,大家就能對需求分析要完成的任務有一些大體的了解了。
在圖2中,需求分析需要完成的任務就是解析出query具有匯率轉換的需求,并解析出數額56.7,以及源貨幣為美元,目標貨幣為人民幣。
------------------------------------------------------------------------------------------
藍點網絡提供:網站建設、APP開發、微信小程序、400電話、軟件開發、服務器托管/租用等業務。
從2003年開始,我們始終堅守【網站建設】服務,19年從未放棄??!
售前咨詢:0311-8736 0077
售后服務:0311-8736 0066
值班手機:189 3198 6878