
對網(wǎng)絡(luò)空間中多源數(shù)據(jù)進(jìn)行質(zhì)量評估,一方面需要建立數(shù)據(jù)模型或提出適當(dāng)?shù)牟蓸臃椒?另一方面,需要提出對采樣數(shù)據(jù)的評價(jià)與檢驗(yàn)方法。網(wǎng)絡(luò)數(shù)據(jù)采樣是將數(shù)據(jù)從Web數(shù)據(jù)庫提取出來的過程。傳統(tǒng)的數(shù)據(jù)庫采樣是隨機(jī)從數(shù)據(jù)庫中選取數(shù)據(jù)記錄以獲得數(shù)據(jù)庫的統(tǒng)計(jì)信息的過程,典型方法可參考文獻(xiàn)。但是要獲取Web數(shù)據(jù)庫中的數(shù)據(jù)只能通過向查詢接口提交查詢﹐不能自由地從Web數(shù)據(jù)庫獲取記錄﹐故而傳統(tǒng)方法不能實(shí)現(xiàn)對Web數(shù)據(jù)庫的采樣。
2021-04-19
679