【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及一種,具體涉及一種利用計(jì)算機(jī)技術(shù)對(duì)農(nóng)產(chǎn)品價(jià)格的長(zhǎng)期趨勢(shì)進(jìn)行預(yù)測(cè)的方法,本專利技術(shù)屬于計(jì)算機(jī)
。
技術(shù)介紹
我國(guó)是一個(gè)農(nóng)業(yè)大國(guó),農(nóng)業(yè)人口眾多,農(nóng)作物種類繁雜。在過去的十幾年里,國(guó)家投入了大量的人力和物力來支持農(nóng)業(yè)和農(nóng)村的經(jīng)濟(jì)發(fā)展,取得了顯著的效果。作為農(nóng)業(yè)和農(nóng)村經(jīng)濟(jì)發(fā)展的一個(gè)組成部分,農(nóng)業(yè)信息化在發(fā)展中起著舉足輕重的作用。農(nóng)業(yè)信息化領(lǐng)域中,監(jiān)測(cè)農(nóng)產(chǎn)品的價(jià)格走勢(shì)并進(jìn)行有效預(yù)測(cè)對(duì)政府進(jìn)行宏觀調(diào)控以及農(nóng)業(yè)生產(chǎn)者制定生產(chǎn)策略都具有十分重要的意義。趨勢(shì),表示事物的發(fā)展動(dòng)向。趨勢(shì)預(yù)測(cè),通常意義下指的是對(duì)于某種物體的發(fā)展動(dòng)向進(jìn)行有規(guī)律地預(yù)測(cè)。對(duì)農(nóng)產(chǎn)品價(jià)格的預(yù)測(cè)包括對(duì)農(nóng)產(chǎn)品的價(jià)格進(jìn)行短期的離散數(shù)據(jù)預(yù)測(cè)和長(zhǎng)期的走勢(shì)預(yù)測(cè)。例如,對(duì)未來5天的西紅柿價(jià)格的具體數(shù)字的預(yù)測(cè)屬于短期預(yù)測(cè),而對(duì)未來I個(gè)月的西紅柿價(jià)格的整體走勢(shì)預(yù)測(cè)屬于長(zhǎng)期預(yù)測(cè)。對(duì)農(nóng)產(chǎn)品價(jià)格進(jìn)行長(zhǎng)期的走勢(shì)預(yù)測(cè),也稱為農(nóng)產(chǎn)品價(jià)格趨勢(shì)預(yù)測(cè)。農(nóng)產(chǎn)品價(jià)格的預(yù)測(cè)趨勢(shì)分為三種:看漲(預(yù)測(cè)的未來趨勢(shì)為上升)、看跌(預(yù)測(cè)的未來趨勢(shì)為下降)、看平(預(yù)測(cè)的未來趨勢(shì)為平穩(wěn))。通過搜集和分析互聯(lián)網(wǎng)上發(fā)布的權(quán)威的專家預(yù)測(cè)觀點(diǎn)進(jìn)而對(duì)農(nóng)產(chǎn)品的未來價(jià)格趨勢(shì)進(jìn)行有效預(yù)測(cè),是本專利技術(shù)的主要目標(biāo)和創(chuàng)新之處。影響農(nóng)產(chǎn)品價(jià)格波動(dòng)的因素有很多,例如季節(jié)性因素、氣候性因素、農(nóng)產(chǎn)品的供需變化和流通成本因素等等,這導(dǎo)致了對(duì)農(nóng)產(chǎn)品的價(jià)格進(jìn)行預(yù)測(cè)是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。目前,國(guó)內(nèi)外對(duì)農(nóng)產(chǎn)品的價(jià)格預(yù)測(cè)主要集中于定性和定量?jī)煞N預(yù)測(cè)方法。定性預(yù)測(cè)方法主要借助于專家的經(jīng)驗(yàn)知識(shí)對(duì)農(nóng)產(chǎn)品的未來走勢(shì)給出個(gè)人主觀預(yù)測(cè),該類方法的主觀隨意性大,預(yù)測(cè)的精確性往往 ...
【技術(shù)保護(hù)點(diǎn)】
農(nóng)產(chǎn)品價(jià)格趨勢(shì)預(yù)測(cè)方法,其特征在于,包括如下步驟:步驟一:通過計(jì)算機(jī)自動(dòng)采集程序從互聯(lián)網(wǎng)網(wǎng)站定時(shí)采集與農(nóng)產(chǎn)品價(jià)格相關(guān)的且?guī)в袑<翌A(yù)測(cè)性觀點(diǎn)的文章;步驟二:對(duì)采集的文章進(jìn)行去重;步驟三:從去重后的文章中提取并保存文章要素,所述文章要素包括文章標(biāo)題、文章正文內(nèi)容、文章來源、文章發(fā)表時(shí)間、文章中帶有專家預(yù)測(cè)性觀點(diǎn)的語句;步驟四:根據(jù)文章標(biāo)題和文章正文內(nèi)容對(duì)文章中描述的農(nóng)產(chǎn)品所屬區(qū)域進(jìn)行識(shí)別;步驟五:根據(jù)文章中帶有專家預(yù)測(cè)性觀點(diǎn)的語句,利用文本挖掘技術(shù)分析出專家對(duì)農(nóng)產(chǎn)品的預(yù)測(cè)性觀點(diǎn),并將所述預(yù)測(cè)性觀點(diǎn)進(jìn)行量化和保存;步驟六:根據(jù)文章發(fā)表時(shí)間、農(nóng)產(chǎn)品所屬區(qū)域、農(nóng)產(chǎn)品種類以及量化的趨勢(shì)預(yù)測(cè)觀點(diǎn)進(jìn)行計(jì)算機(jī)建模,利用建立的模型對(duì)農(nóng)產(chǎn)品價(jià)格進(jìn)行趨勢(shì)預(yù)測(cè)。
【技術(shù)特征摘要】
1.農(nóng)產(chǎn)品價(jià)格趨勢(shì)預(yù)測(cè)方法,其特征在于,包括如下步驟: 步驟一:通過計(jì)算機(jī)自動(dòng)采集程序從互聯(lián)網(wǎng)網(wǎng)站定時(shí)采集與農(nóng)產(chǎn)品價(jià)格相關(guān)的且?guī)в袑<翌A(yù)測(cè)性觀點(diǎn)的文章; 步驟二:對(duì)采集的文章進(jìn)行去重; 步驟三:從去重后的文章中提取并保存文章要素,所述文章要素包括文章標(biāo)題、文章正文內(nèi)容、文章來源、文章發(fā)表時(shí)間、文章中帶有專家預(yù)測(cè)性觀點(diǎn)的語句; 步驟四:根據(jù)文章標(biāo)題和文章正文內(nèi)容對(duì)文章中描述的農(nóng)產(chǎn)品所屬區(qū)域進(jìn)行識(shí)別;步驟五:根據(jù)文章中帶有專家預(yù)測(cè)性觀點(diǎn)的語句,利用文本挖掘技術(shù)分析出專家對(duì)農(nóng)產(chǎn)品的預(yù)測(cè)性觀點(diǎn),并將所述預(yù)測(cè)性觀點(diǎn)進(jìn)行量化和保存; 步驟六:根據(jù)文章發(fā)表時(shí)間、農(nóng)產(chǎn)品所屬區(qū)域、農(nóng)產(chǎn)品種類以及量化的趨勢(shì)預(yù)測(cè)觀點(diǎn)進(jìn)行計(jì)算機(jī)建模,利用建立的模型對(duì)農(nóng)產(chǎn)品價(jià)格進(jìn)行趨勢(shì)預(yù)測(cè)。2.根據(jù)權(quán)利要求1所述的農(nóng)產(chǎn)品價(jià)格趨勢(shì)預(yù)測(cè)方法,其特征在于,所述步驟一包括: 步驟Ia:設(shè)置采集定時(shí)器; 步驟Ib:設(shè)定要采集的互聯(lián)網(wǎng)網(wǎng)站所對(duì)應(yīng)的入口 URL,并將入口 URL進(jìn)行保存,根據(jù)采集定時(shí)器為所述入口 URL分配定時(shí)采集任務(wù); 步驟Ic:對(duì)設(shè)定要采集的互聯(lián)網(wǎng)網(wǎng)站所對(duì)應(yīng)的入口 URL進(jìn)行網(wǎng)頁內(nèi)容下載; 步驟Id:根據(jù)網(wǎng)頁內(nèi)容中的HTML標(biāo)簽,定位需要采集的文章對(duì)應(yīng)的URL ; 步驟Ie:根據(jù)需要采集的文章對(duì)應(yīng)的URL,對(duì)文章對(duì)應(yīng)的網(wǎng)頁內(nèi)容進(jìn)行下載并保存。3.根據(jù)權(quán)利要求2所述的農(nóng)產(chǎn)品價(jià)格趨勢(shì)預(yù)測(cè)方法,其特征在于,所述步驟2b包括:將入口 URL保存到本地的XML文件或本地?cái)?shù)據(jù)庫。4.根據(jù)權(quán)利要求3所述的農(nóng)產(chǎn)品價(jià)格趨勢(shì)預(yù)測(cè)方法,其特征在于,所述步驟二包括: 步驟2a:對(duì)每一篇文章對(duì)應(yīng)的URL字符串利用MD5算法進(jìn)行加密,計(jì)算得到所述文章對(duì)應(yīng)的URL的信息指紋; 步驟2b:進(jìn)行指紋比對(duì),對(duì)于信息指紋相同的文章,只保留其中的一篇; 步驟2c:對(duì)步驟2b處理后保留的文章按照發(fā)表時(shí)間的先后進(jìn)行排序,選擇時(shí)間最靠前的文章作為基點(diǎn)文章,將基點(diǎn)文章和剩余的文章分別進(jìn)行兩兩比對(duì),依次計(jì)算基點(diǎn)文章與剩余的文章之間的標(biāo)題相似度;如果標(biāo)題相似度大于閾值,則認(rèn)為二者標(biāo)題相似,賦予該篇文章與基點(diǎn)文章相同的相似度標(biāo)識(shí),否則,取其余剩余文章繼續(xù)與基點(diǎn)文章進(jìn)行比較,直到剩余全部文章與基點(diǎn)文章比較結(jié)束; 步驟2d:比較結(jié)束后,若還有未賦予相似度標(biāo)識(shí)的文章,則選擇時(shí)間最靠前的文章為新的基點(diǎn)文章,并為該篇文章賦予...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:張偉,歐吉順,周楚新,
申請(qǐng)(專利權(quán))人:南京綠色科技研究院有限公司,
類型:發(fā)明
國(guó)別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。