互聯(lián)網(wǎng)大數(shù)據(jù)的評估與采樣
時間:2021-04-19 17:00
瀏覽:679
對網(wǎng)絡(luò)空間中多源數(shù)據(jù)進(jìn)行質(zhì)量評估,一方面需要建立數(shù)據(jù)模型或提出適當(dāng)?shù)牟蓸臃椒?另一方面,需要提出對采樣數(shù)據(jù)的評價與檢驗(yàn)方法。網(wǎng)絡(luò)數(shù)據(jù)采樣是將數(shù)據(jù)從Web數(shù)據(jù)庫提取出來的過程。傳統(tǒng)的數(shù)據(jù)庫采樣是隨機(jī)從數(shù)據(jù)庫中選取數(shù)據(jù)記錄以獲得數(shù)據(jù)庫的統(tǒng)計信息的過程,典型方法可參考文獻(xiàn)。但是要獲取Web數(shù)據(jù)庫中的數(shù)據(jù)只能通過向查詢接口提交查詢﹐不能自由地從Web數(shù)據(jù)庫獲取記錄﹐故而傳統(tǒng)方法不能實(shí)現(xiàn)對Web數(shù)據(jù)庫的采樣。
對網(wǎng)絡(luò)空間中多源數(shù)據(jù)進(jìn)行質(zhì)量評估,一方面需要建立數(shù)據(jù)模型或提出適當(dāng)?shù)牟蓸臃椒?另一方面,需要提出對采樣數(shù)據(jù)的評價與檢驗(yàn)方法。網(wǎng)絡(luò)數(shù)據(jù)采樣是將數(shù)據(jù)從Web數(shù)據(jù)庫提取出來的過程。傳統(tǒng)的數(shù)據(jù)庫采樣是隨機(jī)從數(shù)據(jù)庫中選取數(shù)據(jù)記錄以獲得數(shù)據(jù)庫的統(tǒng)計信息的過程,典型方法可參考文獻(xiàn)。但是要獲取Web數(shù)據(jù)庫中的數(shù)據(jù)只能通過向查詢接口提交查詢﹐不能自由地從Web數(shù)據(jù)庫獲取記錄﹐故而傳統(tǒng)方法不能實(shí)現(xiàn)對Web數(shù)據(jù)庫的采樣。
針對Web數(shù)據(jù)庫采樣。HIDDEN-DB-SAM-PLER是第一項(xiàng)工作,它給出了對范圍屬性和分類屬性的處理方法﹐而對查詢接口中設(shè)計的必填的可任意取值的關(guān)鍵詞屬性未作處理。提出基于圖模型的增量式Web數(shù)據(jù)庫采樣方法WDB-Sampler,通過查詢接口從Web數(shù)據(jù)庫中以增量的方式獲取近似隨機(jī)的樣本。但是該方法是針對樣本中每條數(shù)據(jù)作為頂點(diǎn)來建立圖模型,每一輪查詢后都要將查詢結(jié)果擴(kuò)充到圖模型中用于產(chǎn)生下一輪查詢詞,這樣做的代價比較高。
相關(guān)閱讀
- ORG代表什么?
- 如何更改網(wǎng)站域名啊
- 怎樣查詢域名有沒有被解析??
- 怎樣自己建網(wǎng)站?
- 頂域名與www二級域名如何做310跳轉(zhuǎn)?
- 我的域名想更換DNS,可以直接修改DNS嗎?
- 萬網(wǎng)會員是什么?
- 誰幫我提供一些申請第二域名的網(wǎng)站
- 申請第二個域名還要備案嗎
- 我剛解析好一個域名,那個DNS用不用修改呀?
- 空間域名不及時續(xù)費(fèi)對網(wǎng)站有什么影響?
- 如何查看網(wǎng)站的制作時間和到期時間呢?
- 怎么快速更新阿里云域名解析
- 在新網(wǎng)備案的域名,可以直接解析到阿里云公網(wǎng)IP嗎?
- 如何把綁定的域名的CNAME解析到siteapp.baidu.com
- 我win7的 電腦 經(jīng)常出現(xiàn) 域名解析文件(Hosts)存在異常
- 用于解析域名的協(xié)議是?
- 域名解析是什么意思
- 如何把域名解析到本地主機(jī)服務(wù)器
- 我現(xiàn)在有域名,域名備案成功了,域名怎么解析到服務(wù)器上,服務(wù)器是朋友的他告訴我了主機(jī)地址,不知道后面怎么弄,需要用到什么軟件
最新資訊