習近平總書記在全國宣傳思想工作會議上提出,宣傳思想工作創(chuàng)新,重點要抓好理念創(chuàng)新、手段創(chuàng)新。這些新思想、新論斷為新形勢下做好網絡輿情監(jiān)測與引導工作提出了新的更高的要求。借助于新理念、新技術、新方法,準確把握網絡輿情的內在特征及其在演化過程中的潛在規(guī)律,對于新形勢下推動網絡媒體與傳統(tǒng)媒體的良性互動,聚合網絡輿論正能量,做好網絡輿論引導和網絡宣傳工作,具有重要的理論意義和實踐價值。

  網絡輿情監(jiān)測與引導呼喚與數據挖掘的有機融合

  云計算、物聯網、智慧城市、大數據等新技術和新理念的出現使網絡輿情支撐技術大環(huán)境正在進行著深刻的變革,給公民聽政、參政、議政、督政提供了新的技術平臺,給黨政機關拓寬了解世情民意的渠道,網絡逐漸成為公眾便捷獲取信息、及時表達民情、充分反映民意的主渠道,同時也必然產生巨大的輿論壓力。隨著海量網絡輿情成指數增加,雖然傳統(tǒng)的數據處理技術能夠較好地完成輿情統(tǒng)計與分析,OLAP等在線分析處理技術也可以實現對輿情研判、決策等基本功能,但很顯然,這些技術由于不支持對海量輿情潛在信息的發(fā)現與挖掘,也無法找到輿情信息間存在的關系或規(guī)則,不能根據現有輿情預測未來發(fā)展趨勢,由此導致了“數據爆炸,知識貧乏”的奇怪現象。時代熱切企盼著網絡輿情引導的理念創(chuàng)新與技術創(chuàng)新。

  在這種背景下,必須充分認識到利用數據挖掘技術進行網絡輿情監(jiān)測、研判和引導的迫切性,發(fā)揮數據挖掘技術在網絡輿情監(jiān)測與引導中的獨特優(yōu)勢,從而實現對網絡輿情及時發(fā)現、快速分析、準確追蹤、理性引導。

  數據挖掘助力網絡輿情監(jiān)測與引導的路徑選擇

  要使數據挖掘有效助力網絡輿情監(jiān)測與引導,首先應根據網絡輿情演化規(guī)律,構建適用于網絡輿情挖掘的相關模型和技術方法,使之滿足網絡等復雜系統(tǒng)中不同輿情對象間的復雜關系分析,從而為網絡輿情挖掘線路與進程提供理論基礎,實現一般數據挖掘模型和技術方法與網絡輿情挖掘與分析的有機融合。數據挖掘技術在網絡輿情引導中的應用可從以下四個方面展開。

  網絡輿情關聯分析。關聯規(guī)則挖掘由Rakesh Apwal等人提出后得到了廣泛應用,如眾人耳熟能詳的啤酒與尿布的營銷策略早已成為超市營銷決策中的經典。時至今日,關聯規(guī)則挖掘的對象也已由基本的關系數據庫拓展到空間數據庫、多媒體數據庫乃至網絡數據庫,并且力求挖掘出用戶感興趣的、深層次的、通用的關聯規(guī)則。輿情關聯關系是網絡輿情數據庫中存在的一類重要的、可被發(fā)現的知識,首先需要分析網絡事件表征參數間的關系,進而發(fā)現網絡輿情中隱藏的輿情關聯。為了更準確表示網絡輿情之間的關聯度,引入網絡輿情支持度和網絡輿情可信度來量化網絡輿情關聯規(guī)則的相關性,從而使挖掘結果更準確。例如,基于網絡輿情關聯規(guī)則挖掘,分析新浪微博中活躍者間關聯強度、堅定支持者人數以及堅定支持者成員的變化頻度等三個時間序列間的關聯規(guī)則,挖掘出新浪微博輿情的關聯關系,進而為輿情研判提供重要依據。

  網絡輿情級別劃分。社會突發(fā)事件根據自身性質、社會危害程度、影響范圍三個指標,可以劃分為四級,即一般嚴重事件、比較嚴重事件、相當嚴重事件與特別嚴重事件。突發(fā)公共事件的等級劃分可以為網絡輿情的級別劃分提供了重要依據。網絡輿情級別劃分是根據網絡輿情的特征判斷該輿情的嚴重程度。在對網絡輿情進行級別劃分時,首先需要構造網絡輿情分類器,然后利用分類器給未知類別的網絡輿情賦予類別。構造分類器的過程一般包括訓練與測試兩個階段。在訓練階段,建立模型描述預定的網絡輿情集的特征,集合中的每一條輿情信息都屬于一個預先給定的類別(如一般嚴重),利用類標簽屬性來標識類別。用于創(chuàng)建模型的網絡輿情集一般被稱為訓練集,可以用數學公式、分類規(guī)則(IF—THEN)、神經網絡或判定樹等模型來描述一個預先確定的輿情集合,即進行有監(jiān)督的學習。在測試階段,使用創(chuàng)建的模型在網絡輿情測試集上進行預測,并將測試結果與實際值進行比較,利用測試集中被正確分類的輿情的百分比來估計模型的準確率。經過以上兩個過程,便可以形成性能穩(wěn)定、準確率較高的網絡輿情分類模型。當新的未知類別的網絡輿情出現后,便可以把該輿情的相關信息輸入到分類模型中,然后由分類模型判斷該輿情的嚴重程度。

  網絡輿情聚類。網絡輿情聚類分析是指事先不了解網絡輿情集合中每一個網絡輿情樣本所屬的程度級別,而是根據網絡輿情的主要特征,如輿情發(fā)生時間、評論數量、傳播頻度等,把相同或相近特征的網絡輿情歸為一類,從而實現輿情聚類。從機器學習的角度講,輿情聚類是搜索輿情簇的無監(jiān)督學習過程。在輿情聚類過程中,分在同一個簇里的輿情對象具有很高的相似性,而不同簇中的輿情對象之間的相似性非常低。所形成的每個輿情簇都可以看作一個輿情類,由它可以導出規(guī)則。與級別劃分不同,聚類只對輿情數據進行分析,由于最初并不知道如何開始,所以訓練輿情數據一般不提供級別標記,但是隨著聚類過程不斷推進,可以自動給不同輿情簇分配對應的輿情級別標記。

  網絡輿情傾向性分析。網絡輿情傾向性是指網民對客觀事物或公共事件所蘊涵的感情、觀點、態(tài)度和立場。網絡具有開放性、虛擬性與匿名性的特征,給公眾提供了真實表達民意、反映民情、抒發(fā)民緒的平臺,同時,網絡的這些特性也容易使普通事件輔以情緒化的評論,從而可能成為點燃網絡輿論的導火索。無論從“我爸是李剛”權力傲慢引起的廣泛關注,還是到“沒有強拆就沒有新中國”畸形強拆觀導致的普遍民憤,無不淋漓盡致地體現了網絡輿情的這些特性。在此情境下,網絡上容易出現激進甚至庸俗、灰色的言論,不利于互聯網健康發(fā)展。因此需要借助新技術研究網絡輿情的傾向性及其形成與擴散特征,有效分析網絡輿情發(fā)生、發(fā)展、變化的規(guī)律,從而為網絡輿情未來的發(fā)展趨勢做出及時、全面、準確的判斷,為相關部門提供重要決策支持。網絡輿情傾向性分析是指通過數據挖掘技術,自動將網絡輿情所包含的褒貶因素挖掘出來,明確信息傳播者的真正意圖和傾向性。網絡輿情傾向性分析主要包括基于語義的網絡輿情傾向性分析與基于機器學習的網絡輿情傾向性分析,目前在技術、方法與模型方面均有深入研究,主要包括序列模式挖掘方法、情感分析、主題分析等。通過這些技術方法,將網絡輿情中豐富的情感傾向進行定性定量分析,及時掌握網絡輿情變化趨勢。在此基礎上,通過對隨時間持續(xù)變化的輿情進行研判,可以較好地把握網絡輿情的演化規(guī)律及動態(tài)。

  數據挖掘視域下網絡輿情監(jiān)測與引導的實踐價值

  新形勢下,強化網絡輿情監(jiān)測與引導工作不僅具有深遠的理論意義,而且具有重大的實踐價值。我們要堅持網絡輿情引導工作的頂層設計和摸著石頭過河相結合的原則,理論研究推進和重點技術突破相促進,充分挖掘網絡輿情傳播的新特征、新規(guī)律、新機理,在網絡輿情監(jiān)測與引導過程中,要把互聯網這個平臺用好、用足、管好、管嚴,進一步提升做好網絡輿情監(jiān)測與引導工作的自覺性、堅定性,進一步增強責任感、使命感;堅守網絡輿論把關人的職責,借力數據挖掘技術不斷創(chuàng)新網絡輿情監(jiān)測與引導的技術方法,著力打造融合數據挖掘技術的網絡輿情監(jiān)測與引導的新理念、新范疇、新應用,牢牢把握正確網絡輿論導向,把互聯網建設成黨的路線方針政策的學習、研究和宣傳的前沿陣地,構筑成開展中國特色社會主義宣傳教育的重要平臺。進而通過網絡引導,努力孕育和積聚正能量,積極培育和踐行社會主義核心價值觀,在網絡引導中致力于全面提高公民道德素質,培育知榮辱、講正氣、作奉獻、促和諧的網絡風尚,鑄就講好中國故事、傳播好中國聲音的網絡輿論生態(tài)。

  【名詞解釋】數據挖掘,也稱作基于數據庫的知識發(fā)現,不僅能對過去的數據進行查詢和遍歷,并且能夠找出過去數據之間的潛在聯系,幫助人們從大量的數據中智能、自動抽取出隱含的、事先未知的、具有潛在價值的知識。

 ?。ū疚南祰倚姓W院招標課題《新媒體管理及網絡輿情引導》與《電子政務環(huán)境下的政府信息公開模式研究》的階段性研究成果。作者單位:國家行政學院電子政務研究中心)

責任編輯:admin