【技術實現步驟摘要】
一種互聯網文檔的總訪問量的估值方法
[0001]本專利技術涉及計算機軟件
,具體涉及一種互聯網文檔的總訪問量的估值方法。
技術介紹
[0002]隨著互聯網技術的不斷發展,以平均每周使用互聯網至少1小時來看作網民的認定標準,截至2021年6月,中國網民規模達10.11億,較2020年12月增長2175萬,互聯網普及率達71.6%。在這么高的普及率的前提下,人們日常的生活逐步遷移至網絡中,尤其是客戶端的APP等的發展,人們逐漸形成了在終端進行碎片化閱讀、評價、點贊、分享等習慣。相對的,對于運營網站或APP的商家或個人來說,了解互聯網中的訪問量或自己網站的訪問量,可以了解用戶的習慣、定向對用戶運營,可以準確找到網絡熱點等,對于運營有極大的作用。
[0003]目前已經存在很多網站訪問量的統計技術,如Alexa是一家專門發布網站世界排名的網站。以搜索引擎起家的Alexa創建于1996年4月(美國),目的是讓互聯網網民在分享虛擬世界資源的同時,更多地參與互聯網資源的組織。Alexa每天在網上搜集超過1,000GB的信息,不僅給出多達幾十億的網址鏈接,而且為其中的每一個網站進行了排名。可以說,Alexa是當前擁有URL數量最龐大,排名信息發布最詳盡的網站。
[0004]目前還有很多研究主要對于頁面訪問量的統計及分析,或基于頁面訪問量的用戶行為分析訪。其中如專利文件1CN106210044B,涉及一種基于訪問行為的活躍用戶識別方法,是依據用戶對網站各個模塊的訪問量,用于判別用戶身份識別方法。如專利文件2,CN1 ...
【技術保護點】
【技術特征摘要】
1.一種互聯網文檔的總訪問量的估值方法,其特征在于,包括以下步驟:S1構建訪問量預估值計算模型:基于網站、app、社交媒體的日平均訪問量,分別構建網站各欄目的訪問量預估值計算模型、app各欄目的訪問量預估值計算模型以及社交媒體模型比例系數計算模型;S2獲取待評估互聯網文檔信息:獲取用戶首發布的原創互聯網文檔,并對所述互聯網文檔在步驟S1中構建的計算模型中進行初始化分析;S3根據計算模型分別預估訪問量:將步驟S2中的初始化值根據步驟S1構建的所述網站各欄目的訪問量預估值計算模型、所述app各欄目的訪問量預估值計算模型以及所述社交媒體模型比例系數計算模型分別計算一段時間內的對應的訪問量預估值,記為網站預估訪問量、app預估訪問量以及社交媒體訪預估問量,并將將其記錄至數據庫的文檔當日訪問量表中;S4計算全網訪問量:對所述網站預估訪問量、app預估訪問量以及社交媒體訪預估問量,這三個值進行求和獲得當日全網總訪問量;再根據發布時間t獲得衰減比例,所述衰減比例計算方法為k=0.963
t
,t為已發布天數,k為衰減比例;首日全網訪問量+當日全網訪問量*k=全網總訪問量,即已發布t天數內的總全網訪問量。2.根據權利要求1所述的互聯網文檔的總訪問量的估值方法,其特征還在于,所述構建網站各欄目的訪問量預估值計算模型包括以下過程:(1)獲取alexa中各個網站近一月日均pv值及排名情況;(2)根據alexa獲取的網站排名情況,在所述數據庫的文檔當日訪問量表中,記錄排名第一的網站的默認訪問量預估值,并依次記錄其他網站的默認訪問量預估值直到記錄到最低值;所述默認訪問量預估值的設置根據近30天的日均pv進行計算,根據網站日均pv值與第一名網站日均pv值對比計算訪問量預估值;(3)根據獲取的待評估的所述互聯網文檔的信息,將轉發過所述互聯網文檔的網站欄目進行整理去重,獲得準確的轉發過所述互聯網文檔的網站欄目列表,進而對所述網站欄目列表中的網站欄目做訪問量預估值的初始化更新,得到所有的所述網站欄目對應的訪問量預估值;(4)判斷所述欄目列表中所有的所述網站欄目,是否包含首頁、輪播、推薦等重點欄目名稱詞匯,若包含,則將得到的所述網站欄目對應的訪問量預估值乘以校正系數x;若不包含,則乘以校正系數y,得到校正后的所述網站欄目對應的訪問量預估值;其中,校正系數x=[1,10],校正系數y=[0.1
?
1]。3.根據權利要求2所述的互聯網文檔的總訪問量的估值方法,其特征還在于,所述步驟(3)具體還包括:通過訪問數據庫,獲取所述互聯網文檔在各個網站的轉發情況,整理成網站
?
欄目的對應關系,將得到的對應關系處理成網站
?
欄目列表的列表,即所述網站欄目列表;若有新的欄目出現,且不存在所述互聯網文檔的欄目列表中,則初始化所述新欄目訪問量預估值,通過訪問數據庫獲取所述網站欄目列表中的所有欄目的訪問量預估值,得到包含新欄目的所有的所述網站欄目對應的訪問量預估值。4.根據權利要求1或2或3所述的互聯網文檔的總訪問量的估值方法,其特征還在于,根據所述網站欄目列表及校正后的所述網站欄目對應的訪問量預估值進行求和,得到
的求和值即為所述互聯網文檔在該網站訪問量預估值;最后,對所有轉發過所述互聯網文檔的網站的訪問量預估值進行求和,即為所述網站預估訪問量。5.根據權利要求1所述的互聯網文檔的總訪問量的估值方法,其特征還在于,所述構建app各欄目的訪問量預估值計算模型,包括以下過程:(1)根據獲取的待評估的所述互聯網文檔的信息,通過數據中心采集所述互聯網文檔在app中的轉發情況,并對采集的數據進行整理去重,得到準確的轉發所述互聯網文檔的app及app中的欄目列表;(...
【專利技術屬性】
技術研發人員:黃鴻發,崔宏彩,趙冠磊,江敏,
申請(專利權)人:拓爾思信息技術股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。