亚洲国产精品无码久久久,偷拍,清纯,欧美,久久精品,亚洲av成人综合网,亚洲av亚洲福利在线观看,午夜一区二区三区亚洲影院电影网

互聯(lián)網(wǎng)大數(shù)據(jù)的評估與采樣

時間:2021-04-19 17:00
瀏覽:679
對網(wǎng)絡(luò)空間中多源數(shù)據(jù)進(jìn)行質(zhì)量評估,一方面需要建立數(shù)據(jù)模型或提出適當(dāng)?shù)牟蓸臃椒?另一方面,需要提出對采樣數(shù)據(jù)的評價與檢驗(yàn)方法。網(wǎng)絡(luò)數(shù)據(jù)采樣是將數(shù)據(jù)從Web數(shù)據(jù)庫提取出來的過程。傳統(tǒng)的數(shù)據(jù)庫采樣是隨機(jī)從數(shù)據(jù)庫中選取數(shù)據(jù)記錄以獲得數(shù)據(jù)庫的統(tǒng)計信息的過程,典型方法可參考文獻(xiàn)。但是要獲取Web數(shù)據(jù)庫中的數(shù)據(jù)只能通過向查詢接口提交查詢﹐不能自由地從Web數(shù)據(jù)庫獲取記錄﹐故而傳統(tǒng)方法不能實(shí)現(xiàn)對Web數(shù)據(jù)庫的采樣。

互聯(lián)網(wǎng)大數(shù)據(jù)的評估與采樣

對網(wǎng)絡(luò)空間中多源數(shù)據(jù)進(jìn)行質(zhì)量評估,一方面需要建立數(shù)據(jù)模型或提出適當(dāng)?shù)牟蓸臃椒?另一方面,需要提出對采樣數(shù)據(jù)的評價與檢驗(yàn)方法。網(wǎng)絡(luò)數(shù)據(jù)采樣是將數(shù)據(jù)從Web數(shù)據(jù)庫提取出來的過程。傳統(tǒng)的數(shù)據(jù)庫采樣是隨機(jī)從數(shù)據(jù)庫中選取數(shù)據(jù)記錄以獲得數(shù)據(jù)庫的統(tǒng)計信息的過程,典型方法可參考文獻(xiàn)。但是要獲取Web數(shù)據(jù)庫中的數(shù)據(jù)只能通過向查詢接口提交查詢﹐不能自由地從Web數(shù)據(jù)庫獲取記錄﹐故而傳統(tǒng)方法不能實(shí)現(xiàn)對Web數(shù)據(jù)庫的采樣。

針對Web數(shù)據(jù)庫采樣。HIDDEN-DB-SAM-PLER是第一項(xiàng)工作,它給出了對范圍屬性和分類屬性的處理方法﹐而對查詢接口中設(shè)計的必填的可任意取值的關(guān)鍵詞屬性未作處理。提出基于圖模型的增量式Web數(shù)據(jù)庫采樣方法WDB-Sampler,通過查詢接口從Web數(shù)據(jù)庫中以增量的方式獲取近似隨機(jī)的樣本。但是該方法是針對樣本中每條數(shù)據(jù)作為頂點(diǎn)來建立圖模型,每一輪查詢后都要將查詢結(jié)果擴(kuò)充到圖模型中用于產(chǎn)生下一輪查詢詞,這樣做的代價比較高。

注 冊

忘記密碼