The embodiment of the present invention discloses a content-based multi-version App update evaluation method and system, which includes: obtaining information and storing it in the database by automatically traversing App; obtaining information in the database for analysis, identification and processing to obtain differences between different versions of App; preprocessing relevant information such as comments information and comments time of App, and obtaining modifications. After that, the user comment information corresponding to each version of App is obtained; the user comment information corresponding to each version of App is obtained after the modification, and the comprehensive emotional analysis value of each App update is obtained by comparing and grading the different versions of App. Implementing the embodiments of the present invention can provide more comprehensive feedback for developers, improve work efficiency, and provide information about specific function life cycle for developers.
【技術(shù)實現(xiàn)步驟摘要】
一種基于內(nèi)容的多版本App更新評價方法及系統(tǒng)
本專利技術(shù)涉及內(nèi)容識別、內(nèi)容比較
,尤其涉及一種基于內(nèi)容的多版本App更新評價方法及系統(tǒng)。
技術(shù)介紹
在移動應(yīng)用開發(fā)中,App版本的更新是很常見的事情。每次更新,應(yīng)用發(fā)布者會發(fā)布更新日志,來說明新版本所做出的主要改變。但是這部分說明只是對于App主要修改的內(nèi)容,或者重點突出的功能進行說明。這部分內(nèi)容并不充分,還有很多修改的內(nèi)容并沒有在更新日志上表示出來。例如淘寶7.11版本App的更新日志中寫到:“消息首頁升級”,“修復(fù)了部分bug”,這些描述十分空泛,不夠具體,而現(xiàn)有的軟件分析,對于版本更新也只有更新日志可以作為標準。內(nèi)容量少,信息不夠具體,這就導(dǎo)致想要篩選有效的更新日志信息費時費力。如果可以標識出兩個版本間所有差異,包括增加的內(nèi)容,刪除的內(nèi)容,將會具有很大的價值。而在對于版本更新問題上的研究,大多著力于對于用戶評論的挖掘。如:在線跟蹤用戶評論,在版本更新的時間節(jié)點,識別出用戶評論中多次提到的問題,從而得出軟件中新出現(xiàn)的問題。如,通過分析App用戶評論,得到用戶評論的情感傾向程度。但是這類研究僅僅分析用戶評論的情感傾向,并沒有對于App更新的內(nèi)容進行評價。綜合此類研究,發(fā)現(xiàn)缺少對于多版本更新內(nèi)容的評價現(xiàn)有方法有很多評論在對App更新進行評價的時候,僅僅取更新日志中的內(nèi)容,之后在用戶評論中對更新的內(nèi)容進行評價或者推薦。如果可以標識出兩個版本間所有差異,包括增加的內(nèi)容,刪除的內(nèi)容,再結(jié)合用戶的評論,對App更新的內(nèi)容進行評價,相信對于開發(fā)者來說會是更具有價值的。現(xiàn)有技術(shù)一涉及一種基于內(nèi)容的計算移動應(yīng)用相似性 ...
【技術(shù)保護點】
1.一種基于內(nèi)容的多版本App更新評價方法,其特征在于,所述方法包括:通過自動遍歷App,獲取App信息并存儲到數(shù)據(jù)庫;獲取數(shù)據(jù)庫中的信息進行分析、識別處理,獲得不同版本App的差異;獲取對App應(yīng)用商店的評論信息及評論時間等相關(guān)信息進行預(yù)處理,獲得修改后與每個版本的App相對應(yīng)的用戶評論信息;獲取所述修改后與每個版本的App相對應(yīng)的用戶評論信息,結(jié)合不同版本App的差異進行比較評分處理,獲得每個App更新的綜合情感分析數(shù)值。
【技術(shù)特征摘要】
1.一種基于內(nèi)容的多版本App更新評價方法,其特征在于,所述方法包括:通過自動遍歷App,獲取App信息并存儲到數(shù)據(jù)庫;獲取數(shù)據(jù)庫中的信息進行分析、識別處理,獲得不同版本App的差異;獲取對App應(yīng)用商店的評論信息及評論時間等相關(guān)信息進行預(yù)處理,獲得修改后與每個版本的App相對應(yīng)的用戶評論信息;獲取所述修改后與每個版本的App相對應(yīng)的用戶評論信息,結(jié)合不同版本App的差異進行比較評分處理,獲得每個App更新的綜合情感分析數(shù)值。2.如權(quán)利要求1所述的一種基于內(nèi)容的多版本App更新評價方法,其特征在于,所述獲取數(shù)據(jù)庫中的信息進行分析、識別處理的具體步驟包括:獲取所述App數(shù)據(jù)進行選取同一個App的不同版本,制成App的不同版本信息的列表,通過java語言進行編寫程序,選擇其中一組,即同一款A(yù)pp所有不同版本的列表;獲取所述同一款A(yù)pp所有不同版本的列表,從中選取相鄰兩個版本的App進行提取該兩個App的界面信息;獲取所述兩個App的界面信息,對其內(nèi)容進行比較處理,獲得兩個具有相似性的界面;獲取所述兩個具有相似性的界面,對所述兩個具有相似性的界面中的所有可見文字進行識別處理,獲得界面內(nèi)所有差異的內(nèi)容。3.如權(quán)利要求2所述的一種基于內(nèi)容的多版本App更新評價方法,其特征在于,所述獲取所述兩個App的界面信息,對其內(nèi)容進行比較處理的具體步驟包括:對舊版本中相同PageId的界面進行定位,抽取PageId相同的新舊版本界面,進行比較界面內(nèi)容,獲得更新的新版本中未比較的界面屬性;定義comp值來衡量兩個界面內(nèi)容相似性,通過App相關(guān)屬性定位相同活動的界面,進行比較,對于英文文本,先對content進行分詞處理,后計算英文單詞的相似度,其具體公式如下:IC(w)=-log(p(w)),其中p(w)是單詞w在WordNetSense中出現(xiàn)的頻率,LCS(w1,w2)是單詞w1和w2的最近公共祖先,兩個單詞的相似度similar(w1,w2)由兩個單詞最近公共祖先信息量的兩倍除以兩個單詞的信息量之和得到。對于中文文本,先進行分詞,之后再進行文本相似性的比較。當comp=1.0時,則判斷為兩個界面是完全相同的界面,記錄下界面信息;當comp=0.0時,則判斷為兩個界面是完全不同的界面,記錄下界面信息;當0.0<comp<1.0時,則判斷為具有一定相似性的兩個界面。4.如權(quán)利要求2所述的一種基于內(nèi)容的多版本App更新評價方法,其特征在于,所述對所述兩個具有相似性的界面中的所有可見文字進行識別處理的具體步驟包括:獲取所述兩個具有相似性的界面進行提取處理,獲得界面所有的控件屬性;對每個控件的屬性中所有可見文字內(nèi)容的集合,定義為T因為兩個界面,所以定義兩個多維向量:Ti={text1,text2,...,textn}Tj={text1,text2,...,textm}Ti表示新版本中所有可見文字內(nèi)容的集合,Tj表示舊版本中所有可見文字內(nèi)容的集合。對所述兩個界面的集合Ti及Tj進行識別處理,如果Ti中textk可在Tj中找到,即新版本內(nèi)容可以在舊版本中找到相同的,則判斷為textk是重復(fù)的內(nèi)容;如果Ti中textk不可在Tj中找到,即新版本內(nèi)容在舊版本中沒有找到相同的,則判斷為textk是增加的內(nèi)容;如果Tj中textl不可在Ti中找到,即舊版本內(nèi)容在新版本中沒有找到相同的,則判斷為textl是刪除的內(nèi)容;獲取識別出的差異內(nèi)容...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:陶良樂,陳湘萍,周凡,
申請(專利權(quán))人:中山大學(xué),
類型:發(fā)明
國別省市:廣東,44
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。