說(shuō)說(shuō)推薦算法
以下內(nèi)容分三部分:算法的核心;算法有多大用;實(shí)際工程中算法怎么工作的
1. 算法的核心是什么
推薦算法的核心是基于歷史信息尋找被推薦的東西(可能是人、物、信息)與用戶的一種關(guān)聯(lián)性,進(jìn)而去預(yù)測(cè)你下一步可能喜歡什么,本質(zhì)上還是基于統(tǒng)計(jì)學(xué)的一種推測(cè)(谷歌的深度學(xué)習(xí)除外)。
這里有兩個(gè)關(guān)鍵點(diǎn):歷史信息;關(guān)聯(lián)性
歷史信息也就是大家所說(shuō)的標(biāo)準(zhǔn)化數(shù)據(jù)
關(guān)聯(lián)性也就是大家常說(shuō)的算法,他做的事情就是猜測(cè)你可能會(huì)喜歡怎樣的東西.要搞清楚這個(gè)問(wèn)題,還是得回到人在不同的場(chǎng)景中會(huì)喜歡怎樣的東西,這個(gè)在不同的場(chǎng)景中差別比較大。舉兩個(gè)例子說(shuō)明一下
對(duì)于微信朋友圈:用戶最關(guān)心的是我跟發(fā)布者的親密度,其次是內(nèi)容的質(zhì)量和內(nèi)容的發(fā)布時(shí)間,這也就是Facebook智能信息流的雛形,根據(jù)跟發(fā)布者的親密度,內(nèi)容的質(zhì)量和內(nèi)容的新鮮程度的一個(gè)混排算法。
對(duì)于美團(tuán)外賣(mài):用戶最關(guān)心的是這家餐廳好不好吃,價(jià)格貴不貴,有沒(méi)有優(yōu)惠,配送時(shí)間長(zhǎng)不長(zhǎng)。至于我認(rèn)不認(rèn)識(shí)這家餐廳的老板,這家餐廳開(kāi)業(yè)時(shí)間就不是重點(diǎn),所以算法就可能是完全不一樣的思路。
不管Facebook信息流還是美團(tuán)外賣(mài),核心還是得去理解用戶在你的產(chǎn)品中到底喜歡怎樣的東西,這個(gè)是基礎(chǔ),算法只是工具。
2. 算法真的有那么大效果嗎
這幾年今日頭條的成功,包括業(yè)內(nèi)各種AI、人工智能的吹,讓我們以為算法無(wú)所不能,實(shí)際上算法真的有這么神奇嗎?
答案是沒(méi)有。。。
今日頭條的成功我認(rèn)為主要還是靠對(duì)流量的理解,戰(zhàn)略和公司的運(yùn)營(yíng)、算法、數(shù)據(jù)化思維形成的執(zhí)行力。算法在里面只是一環(huán)
舉一個(gè)淘寶的例子,去淘寶的人從需求的強(qiáng)弱程度來(lái)看分三種:明確知道我要買(mǎi)啥的,知道我要買(mǎi)啥品類但具體買(mǎi)啥不知道,就是來(lái)逛的。
第一類算法沒(méi)有增長(zhǎng)點(diǎn),我就要買(mǎi)個(gè)蘋(píng)果的iphoneX,你再怎么推薦我也是買(mǎi)個(gè)蘋(píng)果X
第二類算法的增長(zhǎng)點(diǎn)一般,我要買(mǎi)個(gè)藍(lán)牙耳機(jī),算法處理的好能提高成單率,客單價(jià),利潤(rùn),但也是有限的,因?yàn)橛脩暨M(jìn)來(lái)之前已經(jīng)有了一些基本的預(yù)算之類的預(yù)設(shè)。
第三類是比較大的增量空間,因?yàn)榈谌悓儆诩ぐl(fā)性需求。就像你去商場(chǎng)聽(tīng)導(dǎo)購(gòu)一頓忽悠,買(mǎi)了本身不需要的東西。但是第三類的成單量本身的占比并沒(méi)有那么大。
所以綜合下來(lái),算法實(shí)際的效果也就是在完全沒(méi)有算法的基礎(chǔ)上有1.1,1.2,1.3倍這樣的效果,這是由用戶的需求總量決定的。
當(dāng)然我不是說(shuō)算法沒(méi)用,因?yàn)樵谕瘸杀窘Y(jié)構(gòu)的基礎(chǔ)上,你的轉(zhuǎn)化率哪怕比競(jìng)爭(zhēng)對(duì)手高5%,那也是巨大的效率碾壓。我只是想說(shuō)算法沒(méi)有大家吹得那么厲害,并不能直接決定一家公司的成敗,算法只是一個(gè)輔助。
3. 水果店案例說(shuō)明算法在實(shí)際工程中的工作過(guò)程
在實(shí)際的商品類的推薦系統(tǒng)中,主要分三大塊:收集數(shù)據(jù)和整理(商品畫(huà)像、用戶畫(huà)像);算法推薦;上線實(shí)驗(yàn)及回收結(jié)果。
收集數(shù)據(jù)及整理
假設(shè)小明開(kāi)了一個(gè)有3家分店的大型水果連鎖店,收集數(shù)據(jù)階段主要包括:
商品屬性信息:小明將店內(nèi)的每一個(gè)水果以及水果的信息都記下來(lái),甜的還是酸的,品質(zhì)S還是A,有沒(méi)有損壞,性寒還是熱,單價(jià)貴不貴,有沒(méi)有優(yōu)惠等等。這是商品的基本屬性信息。
商品反饋信息:銷量咋樣,停留率咋樣,停留轉(zhuǎn)化率咋樣,用戶的評(píng)價(jià)反饋咋樣。這個(gè)是基本的反饋信息。
人的基本屬性:什么人,什么小區(qū),穿著打扮咋樣,年齡多大,哪里人
人的行為信息:這次買(mǎi)了啥,下次買(mǎi)了啥,看了啥,咨詢過(guò)啥,買(mǎi)完之后反饋咋樣。
數(shù)據(jù)階段收集是一方面,最關(guān)鍵的是收集的數(shù)據(jù)是結(jié)構(gòu)化的,是在用戶的購(gòu)買(mǎi)決策中是有效的,比如說(shuō)用戶中途出去抽了一根煙這種信息就沒(méi)啥用。。。
算法推薦
算法階段關(guān)鍵的還是搞清楚用戶在不同的場(chǎng)景中會(huì)喜歡怎樣的水果。
我個(gè)人喜歡把商品推薦主干算法分為4個(gè)部分:質(zhì)量評(píng)估,個(gè)性化,場(chǎng)景化,人工干預(yù)
質(zhì)量評(píng)估:有些標(biāo)準(zhǔn)是存在絕對(duì)的好與壞的,水果是不是好的,性價(jià)比高不高,銷量好不好,優(yōu)惠力度大不大,用戶反饋好不好這些是存在絕對(duì)的好與壞的,我相信沒(méi)人想買(mǎi)個(gè)爛蘋(píng)果。
個(gè)性化:有些東西是存在個(gè)體差異的,甜的還是酸的,進(jìn)口的還是國(guó)產(chǎn)的,水果的品種是櫻桃還是芒果,性涼還是熱的,品質(zhì)分級(jí)是S還是A(跟前面的爛沒(méi)爛兩個(gè)概念)。
舉個(gè)例子:一個(gè)金融白領(lǐng)可能喜歡的是甜的車?yán)遄?,進(jìn)口的,品質(zhì)S級(jí)的,優(yōu)惠不敏感,客單價(jià)高;而小區(qū)的家庭主婦喜歡的可能是楊梅,品質(zhì)還過(guò)得去的國(guó)產(chǎn)的就行,很在乎優(yōu)惠,客單價(jià)適中的。那對(duì)于前一種用戶就可以推一些客單價(jià)高的,毛利高的進(jìn)口產(chǎn)品,相應(yīng)的也可以少設(shè)置優(yōu)惠;對(duì)于后一種就應(yīng)該推一些性價(jià)比高的,有折扣的清倉(cāng)的商品。
場(chǎng)景化:不同的時(shí)間和地點(diǎn)會(huì)一定程度上影響用戶的消費(fèi)決策,比如夏天大家喜歡吃西瓜,在醫(yī)院邊上香蕉好賣(mài),中午的時(shí)候不帶皮可以直接吃的東西好賣(mài)因?yàn)榇蟛糠窒挛邕€要上班,晚上則需要處理的也賣(mài)的還可以。這個(gè)就是不同的場(chǎng)景帶來(lái)的影響
人工干預(yù):算法本身是不帶意志的,但是很多時(shí)候人會(huì)強(qiáng)加一些意志上去,比如說(shuō)最近年底沖業(yè)績(jī)了,需要強(qiáng)推高毛利的商品了;比如這個(gè)櫻桃是合作方的,需要強(qiáng)推;比如有些東西快過(guò)期了,需要強(qiáng)推。這個(gè)時(shí)候就需要人工去做一些干預(yù)
算法最后做的就是把里面每一個(gè)環(huán)節(jié)打上一個(gè)分,最后再把這些因素去加總得到一個(gè)最后的結(jié)果呈現(xiàn)在用戶面前。但是這個(gè)分怎么打?這個(gè)就涉及到算法的價(jià)值觀
所謂算法的價(jià)值觀,就是你希望算法最終的結(jié)果是怎樣的,我是希望銷量最大化還是銷售額最大化還是利潤(rùn)最大化。不同的目標(biāo)帶來(lái)不同的結(jié)果。因?yàn)樗惴ㄖ皇菫槟繕?biāo)最大化負(fù)責(zé)的。
算法在處理每一項(xiàng)得分的時(shí)候也挺簡(jiǎn)單,簡(jiǎn)單說(shuō)就是,如果我的目標(biāo)是銷量最大化,那有兩個(gè)特征:優(yōu)惠力度,評(píng)價(jià),如果隨著優(yōu)惠力度的提高購(gòu)買(mǎi)轉(zhuǎn)化率急劇提升,那么我認(rèn)為優(yōu)惠力度這個(gè)特征權(quán)重就高,如果隨著評(píng)價(jià)的提升購(gòu)買(mǎi)轉(zhuǎn)化率提升較慢,那么我認(rèn)為評(píng)價(jià)這個(gè)特征的權(quán)重就一般。
這個(gè)過(guò)程并不復(fù)雜,算法的優(yōu)勢(shì)在于他能記錄更豐富的信息(工程中特征數(shù)量可能達(dá)到百萬(wàn)級(jí)),處理海量的數(shù)據(jù)。這是算法比人有優(yōu)勢(shì)的地方
這個(gè)大概能支撐起一個(gè)算法的框架,實(shí)際的應(yīng)用中會(huì)在一個(gè)主干算法的基礎(chǔ)上去迭代很多小的策略。
下面舉幾個(gè)具體的細(xì)分迭代策略:
比如說(shuō)買(mǎi)了芒果的用戶很大比例都買(mǎi)了櫻桃,那相應(yīng)的會(huì)把買(mǎi)芒果的用戶列表中的櫻桃相應(yīng)的往前提。這個(gè)就是大家常說(shuō)的購(gòu)物籃算法
比如說(shuō)同樣是國(guó)貿(mào)摩根大廈的用戶更喜歡進(jìn)口水果,那對(duì)于一個(gè)摩根大廈的用戶他列表中的進(jìn)口水果,高客單價(jià)水果需要往前提。這個(gè)類似協(xié)同過(guò)濾,通過(guò)找到跟你類似的人,再去看他們喜歡啥。
比如說(shuō)你第一次買(mǎi)了榴蓮之后打了差評(píng),以后就需要降低榴蓮及相關(guān)水果的權(quán)重。這個(gè)就是負(fù)反饋。
比如說(shuō)你的列表中連續(xù)出現(xiàn)了3種葡萄,那這時(shí)候大概率是應(yīng)該把他們打散一下,盡量一頁(yè)別出太多葡萄。這就是打散
比如當(dāng)你在瀏覽的過(guò)程中點(diǎn)擊了櫻桃,那根據(jù)購(gòu)物籃原來(lái)喜歡買(mǎi)櫻桃的人也喜歡買(mǎi)芒果,那下一頁(yè)加載的時(shí)候需要?jiǎng)討B(tài)的增加芒果的權(quán)重 — 這個(gè)是實(shí)時(shí)反饋
實(shí)驗(yàn)及回收效果
個(gè)人認(rèn)為快速的實(shí)驗(yàn)迭代和效果回收是算法高效率的關(guān)鍵,也是互聯(lián)網(wǎng)的核心。修路造橋錯(cuò)了就是錯(cuò)了,而互聯(lián)網(wǎng)產(chǎn)品這版效果不好下一版還能優(yōu)化。算法是將這種快速迭代推向了頂峰,同時(shí)幾十個(gè)實(shí)驗(yàn)在線上AB測(cè)試,不需要發(fā)版,好不好馬上就能看出來(lái)。
AB測(cè)試的過(guò)程有點(diǎn)類似如果我有5家水果店,我要驗(yàn)證新引進(jìn)的櫻桃設(shè)置怎樣的價(jià)格能收益最大化,我可以5家店同時(shí)設(shè)置5種價(jià)格,賣(mài)一周看看結(jié)果。
實(shí)驗(yàn)主要分兩個(gè)部分:實(shí)驗(yàn)及效果回收
實(shí)驗(yàn)就是在其它東西都一樣的情況下,留出一個(gè)不一樣的東西,然后觀察最后的結(jié)果,這樣比較好確定最后的結(jié)果差異就是由這個(gè)不一樣的東西帶來(lái)的。
效果回收主要是看數(shù)據(jù)和人去看實(shí)際推薦的結(jié)果,看數(shù)據(jù)需要覆蓋多一些的指標(biāo),因?yàn)楹芸赡茕N量好了毛利降了,或者毛利好了當(dāng)天剩余率升高了。
人工去看結(jié)果主要是一個(gè)二次確定的過(guò)程,比如在頭條里面各種數(shù)據(jù)都很好,但是推出來(lái)的內(nèi)容很低俗,或者這種數(shù)據(jù)好人看完之后憑經(jīng)驗(yàn)知道這不是長(zhǎng)久之計(jì),比如周圍就一家水果店你惡性提價(jià)。。
- ORG代表什么?
- 如何更改網(wǎng)站域名啊
- 怎樣查詢域名有沒(méi)有被解析??
- 怎樣自己建網(wǎng)站?
- 頂域名與www二級(jí)域名如何做310跳轉(zhuǎn)?
- 我的域名想更換DNS,可以直接修改DNS嗎?
- 萬(wàn)網(wǎng)會(huì)員是什么?
- 誰(shuí)幫我提供一些申請(qǐng)第二域名的網(wǎng)站
- 申請(qǐng)第二個(gè)域名還要備案嗎
- 我剛解析好一個(gè)域名,那個(gè)DNS用不用修改呀?
- 空間域名不及時(shí)續(xù)費(fèi)對(duì)網(wǎng)站有什么影響?
- 如何查看網(wǎng)站的制作時(shí)間和到期時(shí)間呢?
- 怎么快速更新阿里云域名解析
- 在新網(wǎng)備案的域名,可以直接解析到阿里云公網(wǎng)IP嗎?
- 如何把綁定的域名的CNAME解析到siteapp.baidu.com
- 我win7的 電腦 經(jīng)常出現(xiàn) 域名解析文件(Hosts)存在異常
- 用于解析域名的協(xié)議是?
- 域名解析是什么意思
- 如何把域名解析到本地主機(jī)服務(wù)器
- 我現(xiàn)在有域名,域名備案成功了,域名怎么解析到服務(wù)器上,服務(wù)器是朋友的他告訴我了主機(jī)地址,不知道后面怎么弄,需要用到什么軟件
-
一級(jí)域名二級(jí)域名三級(jí)域名有哪些?
-
機(jī)頂盒dns解析狀態(tài)異常怎么處理?
-
ttl是什么意思?
-
迅雷下載時(shí)總是顯示連接資源,怎么辦?
-
互聯(lián)網(wǎng)公司是做什么的?
-
粵政易用手機(jī)如何編輯文件?
-
怎么修改網(wǎng)頁(yè)游戲里面的,游戲數(shù)據(jù)?
-
智聯(lián)招聘網(wǎng)怎樣修改個(gè)人資料?
-
360種子在線編輯器 磁力鏈接怎么編輯
-
廈門(mén)的電信DNS服務(wù)器地址是多少
-
夸克可以在線編輯文檔嗎?
-
cc是什么意思?
-
阿里巴巴的背景資料?
-
網(wǎng)絡(luò)零售的劣勢(shì)和不足有哪些,如何克服
-
網(wǎng)頁(yè)考試試題