支持個(gè)性化服務(wù)的移動(dòng)門戶系統(tǒng)的設(shè)計(jì)與開(kāi)發(fā)
桐城師范高等?茖W(xué)校 理工系 李 媛 2016/10/2 11:06:19
作者簡(jiǎn)介:李媛,碩士研究生,講師,桐城師范高等?茖W(xué)校,研究方向:多媒體網(wǎng)絡(luò)教育、教育信息化。
基金項(xiàng)目:安徽省2016年度自然科學(xué)重點(diǎn)資助項(xiàng)目“區(qū)域內(nèi)農(nóng)村電子商務(wù)B2C模式信息不對(duì)稱問(wèn)題研究” 課題編號(hào):KJ2016A699
2015年桐城師范高等?茖W(xué)校校級(jí)教研課題“高職院校微課程資源開(kāi)發(fā)與應(yīng)用研究” 課題編號(hào):Tcszjy002
摘要:移動(dòng)門戶對(duì)于提升用戶的便利性、個(gè)性化附加值等方面十分有益。本文主要分析移動(dòng)門戶的一些特性,以及設(shè)計(jì)開(kāi)發(fā)的一個(gè)能夠支持個(gè)性化服務(wù)的移動(dòng)門戶系統(tǒng)。
關(guān)鍵詞:個(gè)性化服務(wù);移動(dòng)門戶系統(tǒng);設(shè)計(jì)開(kāi)發(fā)
隨著移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來(lái),人們獲取信息的方法越來(lái)越豐富,不再局限于傳統(tǒng)的瀏覽器,但由于移動(dòng)門戶系統(tǒng)設(shè)計(jì)開(kāi)發(fā)需要花費(fèi)大量的資金,許多網(wǎng)站都沒(méi)有開(kāi)發(fā)出針對(duì)移動(dòng)用戶的個(gè)性化服務(wù)。隨著科學(xué)技術(shù)的不斷發(fā)展,基于移動(dòng)門戶的個(gè)性化服務(wù)技術(shù)有了較大的進(jìn)步,但是,用戶訪問(wèn)延時(shí)、信息抽取過(guò)濾等等問(wèn)題依然是需要研究的重點(diǎn),本文針對(duì)這些問(wèn)題提出一種能夠支持個(gè)性化服務(wù)的手機(jī)門戶系統(tǒng)。
一、系統(tǒng)設(shè)計(jì)概述
手機(jī)門戶系統(tǒng)設(shè)計(jì)時(shí)需要從四大功能模塊進(jìn)行開(kāi)展,即檔案管理、資源預(yù)取、內(nèi)容抽取適配及客戶端。本文提出服務(wù)說(shuō)明文件( PSDF)的概念,下文的分析設(shè)計(jì)都是以該種形式進(jìn)行描述的,此外原音的噪聲過(guò)濾及抽取適配也是在此基礎(chǔ)上采用一定的算法。網(wǎng)絡(luò)數(shù)據(jù)源包括RSS數(shù)據(jù)源及其它各種格式的數(shù)據(jù)源,形式十分豐富,在實(shí)際的應(yīng)用過(guò)程中,首先由內(nèi)容抽取模塊抽取、解析信息源,過(guò)濾完成后,將信息生成為PSDF文檔,交由檔案管理模塊對(duì)其進(jìn)行存儲(chǔ)管理。資源預(yù)取模塊由Cache 子模塊、Content Recommendation及Management tools三部分共同組成。信息源預(yù)取時(shí),首先將PSDF文檔進(jìn)行解析,然后將興趣規(guī)則提取出來(lái),最后緩存預(yù)取資源?蛻舳四K與檔案管理模塊共同作用,為移動(dòng)用戶提供個(gè)性化展示的服務(wù)。
二、設(shè)計(jì)與開(kāi)發(fā)方法
(一)服務(wù)說(shuō)明文件
本文的應(yīng)用是以PSDF形式部署的,應(yīng)用類型的豐富程度與PSDF表達(dá)能力息息相關(guān)。在服務(wù)說(shuō)明文件中,多個(gè)語(yǔ)句構(gòu)成一個(gè)服務(wù)描述,每一個(gè)語(yǔ)句都是由屬性值、屬性類型及屬性名稱共同組成,數(shù)據(jù)的組織方式主要是樹(shù)狀,每一種應(yīng)用的類型不同,對(duì)應(yīng)的PSDF也不同,因此,門戶服務(wù)器可以根據(jù)PSDF解析出不同的文本格式。Content節(jié)點(diǎn)是PSDF的頭尾標(biāo)識(shí),
應(yīng)用數(shù)據(jù)的核心載體是Item節(jié)點(diǎn)間的內(nèi)容,每一類應(yīng)用的PSDF都包含了三個(gè)結(jié)點(diǎn),其中包括1個(gè)或多個(gè)Item節(jié)點(diǎn),Item節(jié)點(diǎn)內(nèi)部包含了Time stamp及View group兩個(gè)屬性值。內(nèi)容提供者根據(jù)應(yīng)用類型合理的選擇自定義擴(kuò)展詞匯表,移動(dòng)門戶通過(guò)View group了解用戶請(qǐng)求時(shí)序,然后將相應(yīng)的節(jié)點(diǎn)數(shù)據(jù)抽取合并處理發(fā)送給客戶端。
(二)檔案管理模塊
檔案管理模塊由兩部分組成,即檔案編輯器及檔案持久化模塊。檔案數(shù)據(jù)包括設(shè)備檔案、內(nèi)容檔案、欄目檔案幾種。用戶的偏好不同,訂閱存儲(chǔ)的應(yīng)用分類信息及欄目會(huì)存在差別,這種個(gè)性化偏好即定義為內(nèi)容檔案。移動(dòng)終端的色調(diào)風(fēng)格、屏幕大小等等信息成為設(shè)備檔案,應(yīng)用欄目本身的檔案為欄目檔案,系統(tǒng)檔案數(shù)據(jù)之間的關(guān)系十分復(fù)雜,為了保證檔案管理更加清晰、便捷,移動(dòng)門戶系統(tǒng)中檔案信息及它們的關(guān)系由關(guān)系型數(shù)據(jù)庫(kù)(RDBMS)進(jìn)行存儲(chǔ),存儲(chǔ)時(shí)保證數(shù)據(jù)的組織、檔案的存儲(chǔ)冗余最小。存儲(chǔ)模型應(yīng)包括User、Section、Label、Section Label、User Preference幾部分,每個(gè)部分包含的檔案信息不同,比如用戶的GUID及設(shè)備檔案包含在User中,分類名稱、分類號(hào)包含在Label中。
(三)內(nèi)容抽取適配模塊
內(nèi)容抽取模塊使用門戶服務(wù)器的計(jì)算功能收集處理信息,去除掉信息中的噪聲塊,將核心信息從實(shí)體中抽取出來(lái),并根據(jù)一些特定的參數(shù)將信息進(jìn)行調(diào)整適配,最后發(fā)送到客戶端。實(shí)際運(yùn)行時(shí),首先經(jīng)網(wǎng)頁(yè)信息提取出來(lái),去除掉垃圾信息,找到信息的核心快,將非噪聲塊進(jìn)行標(biāo)記后壓縮合并得到DOM 文檔,然后生成PSDF文件,將文件部署在門戶服務(wù)器上,將內(nèi)容進(jìn)行適配后發(fā)送給客戶端。
(四)資源預(yù)取模塊
信息源的抽取適配離不開(kāi)計(jì)算,由于信息源眾多,門戶服務(wù)器的計(jì)算量巨大,當(dāng)用戶較多時(shí),同一個(gè)信息可能會(huì)被許多用戶請(qǐng)求,如果重復(fù)進(jìn)行信息源的抽取會(huì)極大的增加服務(wù)器的工作量。為此,系統(tǒng)可以將抽取后的信息內(nèi)容緩存在門戶服務(wù)器的內(nèi)存中。設(shè)計(jì)時(shí),可以采用如下思路:服務(wù)器將內(nèi)容解析后,將其放在全局緩存中,系統(tǒng)接收到用戶請(qǐng)求后直接從中檢索,為了提高(未完,下一頁(yè))
|