亚洲国产精品无码久久久,偷拍,清纯,欧美,久久精品,亚洲av成人综合网,亚洲av亚洲福利在线观看,午夜一区二区三区亚洲影院电影网

說(shuō)說(shuō)推薦算法

時(shí)間:2021-04-19 17:11
瀏覽:497
推薦算法是個(gè)很大的話題,實(shí)際工程中也是很多策略交織在一起,所以本文主要是盡量通俗易懂的講清楚推薦算法是個(gè)什么東西,不追求深入、全面和絕對(duì)的精確!輕噴

說(shuō)說(shuō)推薦算法

以下內(nèi)容分三部分:算法的核心;算法有多大用;實(shí)際工程中算法怎么工作的

1. 算法的核心是什么

推薦算法的核心是基于歷史信息尋找被推薦的東西(可能是人、物、信息)與用戶的一種關(guān)聯(lián)性,進(jìn)而去預(yù)測(cè)你下一步可能喜歡什么,本質(zhì)上還是基于統(tǒng)計(jì)學(xué)的一種推測(cè)(谷歌的深度學(xué)習(xí)除外)。

這里有兩個(gè)關(guān)鍵點(diǎn):歷史信息;關(guān)聯(lián)性

歷史信息也就是大家所說(shuō)的標(biāo)準(zhǔn)化數(shù)據(jù)

關(guān)聯(lián)性也就是大家常說(shuō)的算法,他做的事情就是猜測(cè)你可能會(huì)喜歡怎樣的東西.要搞清楚這個(gè)問(wèn)題,還是得回到人在不同的場(chǎng)景中會(huì)喜歡怎樣的東西,這個(gè)在不同的場(chǎng)景中差別比較大。舉兩個(gè)例子說(shuō)明一下

對(duì)于微信朋友圈:用戶最關(guān)心的是我跟發(fā)布者的親密度,其次是內(nèi)容的質(zhì)量和內(nèi)容的發(fā)布時(shí)間,這也就是Facebook智能信息流的雛形,根據(jù)跟發(fā)布者的親密度,內(nèi)容的質(zhì)量和內(nèi)容的新鮮程度的一個(gè)混排算法。

對(duì)于美團(tuán)外賣(mài):用戶最關(guān)心的是這家餐廳好不好吃,價(jià)格貴不貴,有沒(méi)有優(yōu)惠,配送時(shí)間長(zhǎng)不長(zhǎng)。至于我認(rèn)不認(rèn)識(shí)這家餐廳的老板,這家餐廳開(kāi)業(yè)時(shí)間就不是重點(diǎn),所以算法就可能是完全不一樣的思路。

不管Facebook信息流還是美團(tuán)外賣(mài),核心還是得去理解用戶在你的產(chǎn)品中到底喜歡怎樣的東西,這個(gè)是基礎(chǔ),算法只是工具。

2. 算法真的有那么大效果嗎

這幾年今日頭條的成功,包括業(yè)內(nèi)各種AI、人工智能的吹,讓我們以為算法無(wú)所不能,實(shí)際上算法真的有這么神奇嗎?

答案是沒(méi)有。。。

今日頭條的成功我認(rèn)為主要還是靠對(duì)流量的理解,戰(zhàn)略和公司的運(yùn)營(yíng)、算法、數(shù)據(jù)化思維形成的執(zhí)行力。算法在里面只是一環(huán)

舉一個(gè)淘寶的例子,去淘寶的人從需求的強(qiáng)弱程度來(lái)看分三種:明確知道我要買(mǎi)啥的,知道我要買(mǎi)啥品類但具體買(mǎi)啥不知道,就是來(lái)逛的。

第一類算法沒(méi)有增長(zhǎng)點(diǎn),我就要買(mǎi)個(gè)蘋(píng)果的iphoneX,你再怎么推薦我也是買(mǎi)個(gè)蘋(píng)果X

第二類算法的增長(zhǎng)點(diǎn)一般,我要買(mǎi)個(gè)藍(lán)牙耳機(jī),算法處理的好能提高成單率,客單價(jià),利潤(rùn),但也是有限的,因?yàn)橛脩暨M(jìn)來(lái)之前已經(jīng)有了一些基本的預(yù)算之類的預(yù)設(shè)。

第三類是比較大的增量空間,因?yàn)榈谌悓儆诩ぐl(fā)性需求。就像你去商場(chǎng)聽(tīng)導(dǎo)購(gòu)一頓忽悠,買(mǎi)了本身不需要的東西。但是第三類的成單量本身的占比并沒(méi)有那么大。

所以綜合下來(lái),算法實(shí)際的效果也就是在完全沒(méi)有算法的基礎(chǔ)上有1.1,1.2,1.3倍這樣的效果,這是由用戶的需求總量決定的。

當(dāng)然我不是說(shuō)算法沒(méi)用,因?yàn)樵谕瘸杀窘Y(jié)構(gòu)的基礎(chǔ)上,你的轉(zhuǎn)化率哪怕比競(jìng)爭(zhēng)對(duì)手高5%,那也是巨大的效率碾壓。我只是想說(shuō)算法沒(méi)有大家吹得那么厲害,并不能直接決定一家公司的成敗,算法只是一個(gè)輔助。

3. 水果店案例說(shuō)明算法在實(shí)際工程中的工作過(guò)程

在實(shí)際的商品類的推薦系統(tǒng)中,主要分三大塊:收集數(shù)據(jù)和整理(商品畫(huà)像、用戶畫(huà)像);算法推薦;上線實(shí)驗(yàn)及回收結(jié)果。

收集數(shù)據(jù)及整理

假設(shè)小明開(kāi)了一個(gè)有3家分店的大型水果連鎖店,收集數(shù)據(jù)階段主要包括:

商品屬性信息:小明將店內(nèi)的每一個(gè)水果以及水果的信息都記下來(lái),甜的還是酸的,品質(zhì)S還是A,有沒(méi)有損壞,性寒還是熱,單價(jià)貴不貴,有沒(méi)有優(yōu)惠等等。這是商品的基本屬性信息。

商品反饋信息:銷量咋樣,停留率咋樣,停留轉(zhuǎn)化率咋樣,用戶的評(píng)價(jià)反饋咋樣。這個(gè)是基本的反饋信息。

人的基本屬性:什么人,什么小區(qū),穿著打扮咋樣,年齡多大,哪里人

人的行為信息:這次買(mǎi)了啥,下次買(mǎi)了啥,看了啥,咨詢過(guò)啥,買(mǎi)完之后反饋咋樣。

數(shù)據(jù)階段收集是一方面,最關(guān)鍵的是收集的數(shù)據(jù)是結(jié)構(gòu)化的,是在用戶的購(gòu)買(mǎi)決策中是有效的,比如說(shuō)用戶中途出去抽了一根煙這種信息就沒(méi)啥用。。。

算法推薦

算法階段關(guān)鍵的還是搞清楚用戶在不同的場(chǎng)景中會(huì)喜歡怎樣的水果。

我個(gè)人喜歡把商品推薦主干算法分為4個(gè)部分:質(zhì)量評(píng)估,個(gè)性化,場(chǎng)景化,人工干預(yù)

質(zhì)量評(píng)估:有些標(biāo)準(zhǔn)是存在絕對(duì)的好與壞的,水果是不是好的,性價(jià)比高不高,銷量好不好,優(yōu)惠力度大不大,用戶反饋好不好這些是存在絕對(duì)的好與壞的,我相信沒(méi)人想買(mǎi)個(gè)爛蘋(píng)果。

個(gè)性化:有些東西是存在個(gè)體差異的,甜的還是酸的,進(jìn)口的還是國(guó)產(chǎn)的,水果的品種是櫻桃還是芒果,性涼還是熱的,品質(zhì)分級(jí)是S還是A(跟前面的爛沒(méi)爛兩個(gè)概念)。

舉個(gè)例子:一個(gè)金融白領(lǐng)可能喜歡的是甜的車?yán)遄?,進(jìn)口的,品質(zhì)S級(jí)的,優(yōu)惠不敏感,客單價(jià)高;而小區(qū)的家庭主婦喜歡的可能是楊梅,品質(zhì)還過(guò)得去的國(guó)產(chǎn)的就行,很在乎優(yōu)惠,客單價(jià)適中的。那對(duì)于前一種用戶就可以推一些客單價(jià)高的,毛利高的進(jìn)口產(chǎn)品,相應(yīng)的也可以少設(shè)置優(yōu)惠;對(duì)于后一種就應(yīng)該推一些性價(jià)比高的,有折扣的清倉(cāng)的商品。

場(chǎng)景化:不同的時(shí)間和地點(diǎn)會(huì)一定程度上影響用戶的消費(fèi)決策,比如夏天大家喜歡吃西瓜,在醫(yī)院邊上香蕉好賣(mài),中午的時(shí)候不帶皮可以直接吃的東西好賣(mài)因?yàn)榇蟛糠窒挛邕€要上班,晚上則需要處理的也賣(mài)的還可以。這個(gè)就是不同的場(chǎng)景帶來(lái)的影響

人工干預(yù):算法本身是不帶意志的,但是很多時(shí)候人會(huì)強(qiáng)加一些意志上去,比如說(shuō)最近年底沖業(yè)績(jī)了,需要強(qiáng)推高毛利的商品了;比如這個(gè)櫻桃是合作方的,需要強(qiáng)推;比如有些東西快過(guò)期了,需要強(qiáng)推。這個(gè)時(shí)候就需要人工去做一些干預(yù)

算法最后做的就是把里面每一個(gè)環(huán)節(jié)打上一個(gè)分,最后再把這些因素去加總得到一個(gè)最后的結(jié)果呈現(xiàn)在用戶面前。但是這個(gè)分怎么打?這個(gè)就涉及到算法的價(jià)值觀

所謂算法的價(jià)值觀,就是你希望算法最終的結(jié)果是怎樣的,我是希望銷量最大化還是銷售額最大化還是利潤(rùn)最大化。不同的目標(biāo)帶來(lái)不同的結(jié)果。因?yàn)樗惴ㄖ皇菫槟繕?biāo)最大化負(fù)責(zé)的。

算法在處理每一項(xiàng)得分的時(shí)候也挺簡(jiǎn)單,簡(jiǎn)單說(shuō)就是,如果我的目標(biāo)是銷量最大化,那有兩個(gè)特征:優(yōu)惠力度,評(píng)價(jià),如果隨著優(yōu)惠力度的提高購(gòu)買(mǎi)轉(zhuǎn)化率急劇提升,那么我認(rèn)為優(yōu)惠力度這個(gè)特征權(quán)重就高,如果隨著評(píng)價(jià)的提升購(gòu)買(mǎi)轉(zhuǎn)化率提升較慢,那么我認(rèn)為評(píng)價(jià)這個(gè)特征的權(quán)重就一般。

這個(gè)過(guò)程并不復(fù)雜,算法的優(yōu)勢(shì)在于他能記錄更豐富的信息(工程中特征數(shù)量可能達(dá)到百萬(wàn)級(jí)),處理海量的數(shù)據(jù)。這是算法比人有優(yōu)勢(shì)的地方

這個(gè)大概能支撐起一個(gè)算法的框架,實(shí)際的應(yīng)用中會(huì)在一個(gè)主干算法的基礎(chǔ)上去迭代很多小的策略。

下面舉幾個(gè)具體的細(xì)分迭代策略:

比如說(shuō)買(mǎi)了芒果的用戶很大比例都買(mǎi)了櫻桃,那相應(yīng)的會(huì)把買(mǎi)芒果的用戶列表中的櫻桃相應(yīng)的往前提。這個(gè)就是大家常說(shuō)的購(gòu)物籃算法

比如說(shuō)同樣是國(guó)貿(mào)摩根大廈的用戶更喜歡進(jìn)口水果,那對(duì)于一個(gè)摩根大廈的用戶他列表中的進(jìn)口水果,高客單價(jià)水果需要往前提。這個(gè)類似協(xié)同過(guò)濾,通過(guò)找到跟你類似的人,再去看他們喜歡啥。

比如說(shuō)你第一次買(mǎi)了榴蓮之后打了差評(píng),以后就需要降低榴蓮及相關(guān)水果的權(quán)重。這個(gè)就是負(fù)反饋。

比如說(shuō)你的列表中連續(xù)出現(xiàn)了3種葡萄,那這時(shí)候大概率是應(yīng)該把他們打散一下,盡量一頁(yè)別出太多葡萄。這就是打散

比如當(dāng)你在瀏覽的過(guò)程中點(diǎn)擊了櫻桃,那根據(jù)購(gòu)物籃原來(lái)喜歡買(mǎi)櫻桃的人也喜歡買(mǎi)芒果,那下一頁(yè)加載的時(shí)候需要?jiǎng)討B(tài)的增加芒果的權(quán)重 — 這個(gè)是實(shí)時(shí)反饋

實(shí)驗(yàn)及回收效果

個(gè)人認(rèn)為快速的實(shí)驗(yàn)迭代和效果回收是算法高效率的關(guān)鍵,也是互聯(lián)網(wǎng)的核心。修路造橋錯(cuò)了就是錯(cuò)了,而互聯(lián)網(wǎng)產(chǎn)品這版效果不好下一版還能優(yōu)化。算法是將這種快速迭代推向了頂峰,同時(shí)幾十個(gè)實(shí)驗(yàn)在線上AB測(cè)試,不需要發(fā)版,好不好馬上就能看出來(lái)。

AB測(cè)試的過(guò)程有點(diǎn)類似如果我有5家水果店,我要驗(yàn)證新引進(jìn)的櫻桃設(shè)置怎樣的價(jià)格能收益最大化,我可以5家店同時(shí)設(shè)置5種價(jià)格,賣(mài)一周看看結(jié)果。

實(shí)驗(yàn)主要分兩個(gè)部分:實(shí)驗(yàn)及效果回收

實(shí)驗(yàn)就是在其它東西都一樣的情況下,留出一個(gè)不一樣的東西,然后觀察最后的結(jié)果,這樣比較好確定最后的結(jié)果差異就是由這個(gè)不一樣的東西帶來(lái)的。

效果回收主要是看數(shù)據(jù)和人去看實(shí)際推薦的結(jié)果,看數(shù)據(jù)需要覆蓋多一些的指標(biāo),因?yàn)楹芸赡茕N量好了毛利降了,或者毛利好了當(dāng)天剩余率升高了。

人工去看結(jié)果主要是一個(gè)二次確定的過(guò)程,比如在頭條里面各種數(shù)據(jù)都很好,但是推出來(lái)的內(nèi)容很低俗,或者這種數(shù)據(jù)好人看完之后憑經(jīng)驗(yàn)知道這不是長(zhǎng)久之計(jì),比如周圍就一家水果店你惡性提價(jià)。。

注 冊(cè)

忘記密碼