一、民意調查迎來新機遇
2016年4月召開的網絡安全和信息化工作座談會上,習近平指出“網民來自老百姓,老百姓上了網,民意也就上了網”,民意上網,道出了大數據時代社情民意表達渠道發生的質變。在網絡上產生的民意數據以及CATI等調查手段獲取的數據,都難以在可承受的時間范圍內用常規軟件工具進行捕捉、管理和處理,需要以新的處理模式挖掘出具有更強的決策力、洞察發現力的信息。海量社情民意信息的獲取、存儲和處理為社情民意調查機構全面升級創造了新的機遇。
大幅度增加的調查樣本量,為更大范圍內獲取民意創造了條件。大數據時代,調查手段和方法的更新升級,調查機構可以就老百姓和決策層關心的重大問題,在更大范圍內開展專門調查,收集樣本,樣本的擴大可以降低小樣本條件下的樣本選擇偏差。由此收集到的信息,能夠更為廣泛地反映社情民意;其次,利用網上調查系統,可以使不同受訪者所看到的問卷形式更具個性化、有針對性,從而增加調查的親和力。
社情民意上網,增加了收集群眾自發式意愿的主渠道。大數據互聯網技術的發展,使人們的生產生活越來越具有數字化特征,也就意味著人們的思維、情緒、心理也可以被數據量化并在網絡上傳播出來。對民眾自主表達的意見,可以采用網絡爬蟲、網絡調查等方式收集。網上調查省時省費的特點,能更好地在網絡上及時洞察民意動向,了解群眾的呼聲。此外,隨著信息終端技術的發展,通過手機、可穿戴設備推送調查問卷,不僅拓展了獲取信息的渠道,還能夠與其他渠道相互配合,構建立體互補的社情民意渠道網絡。
調查和處理數據快捷性,為及時獲取民意科學決策提供了可能。大數據時代,信息的收集和更新速度可以非常快、時效性很強。結合網絡和各種終端收集和處理調查數據,大大縮短了調查周期,對數據的實時采集、實時加工、實時分發成為可能,為在較短時間內提供科學決策的民意基礎帶來了機遇。
從范圍到內容的可控性,為數據的可靠性提供了保障。以網絡為基礎的CAWI等調查方式,與傳統調查方式比較,在樣本選擇、問卷設計、質量監督等方面能有效控制。由于網上調查的實時控制,可以有效避免訪員作弊、錄入人員出錯等人為偏差出現。在樣本處理過程中,能有效避免后期查錯、復核、補充樣本等錯誤,提高數據的質量,增強調查結果的公信力。
高質量數據的積累,為調查和處理數據方法的創新提供了基礎。數據存儲技術的發展,為積累高質量調查數據提供了條件。數據作為社情民意的載體,同所有數據一樣,都位于一個連續的時間軸上,都有時間屬性。不同時期的社情民意數據有著不同的價值特性,積累的數據具有總體或趨勢分析價值,新數據則更具有時效價值。分析處理積累的數據,成為創新大數據統計分析方法的重要基礎。
二、民意調查面臨挑戰
需要清醒地認識到,通過收集整理的社情民意大數據本身并沒有也不直接產生價值,只有對其進行有效地管理、加工,挖掘出隱藏在其中的有用信息并加以合理、有效地利用,才能使其充分發揮作用,產生價值。因此,社情民意大數據本身及其管理、加工、應用等方面都面臨新的挑戰。
數據噪聲污染,對數據甄別和清洗以獲取真實信息提出了新的要求。無論是通過網絡抓取還是專項調查獲取的社情民意數據,其數據體量都在不斷擴大,然而,在這些海量數據中,并非所有的數據都有用,多數場合,經過加工獲得的信息只是其中的一部分。隨著數據量的不斷增加,冗余數據會越來越多且充斥著虛假信息,重要數據信息會被龐大數據伴隨的噪聲所污染,因此,如何從海量數據中及時獲取真實信息,不僅僅需要依靠技術手段,同時考驗著研究者和決策者的分析判斷能力。
數據完整性的缺失,成為全面洞察社情民意的障礙。理論上講,可以在短期內得到反映社情民意的完整數據,但社情民意涉及面廣、數據量大,調查機構所能獲取的數據所包含的實際信息有限,以致難以全面刻畫民意。這種不完整既包括信息維度的缺失,又包括信息深度的缺失。目前的大數據依然以數據豎井的形式存在,沒有任何一個調查機構能獲取在廣度和深度上都足夠充分的數據。而大數據的價值恰恰在于廣泛的交叉融合,需要跨界的數據集合。因此,整合社會大數據,是社情民意調查工作中面臨的新問題。
數據量的增大,并不意味著利用過去的數據就能夠更好地預測未來。對社情民意大數據的分析,從根本上講僅僅是對過去和現實的歸納和總結,本身并不具有可預測性特征。決定民意走向的是各種內外因素及相互作用,并不是大數據自身能夠解決的問題。風險與大數據并行,大數據有可能會把我們鎖定在以往的錯誤當中,使我們墮入讓過去決定未來的陷阱。過分依賴大數據和預測模型存在較大風險,因為有許多決定性的影響因素都不能納入模型參數的覆蓋范圍之內。因此,研究合適的方法,預測民意走向是面臨的又一重要挑戰。
此外,社情民意大數據的采集、使用過程都極有可能會涉及個人隱私、公眾權益,安全性和合法性等也是社情民意調查中面臨的挑戰。
三、民意調查的變化趨勢
社情民意調查機構作為數據資產的管理者,需要進一步把握社情民意大數據的特征,預見變化趨勢,以新的處理模式管理海量、高增長和多樣化的社情民意信息資產,創造自己的競爭優勢。
社情民意數據的資產化。所謂資產化,是指大數據成為社會所關注的重要戰略資源,無論是挖掘公共數據還是專項調查獲取數據,都是一項經濟活動,其采集、存儲、加工和使用都需要耗費的資金和時間成本。作為大數據資產管理方,應該在投入和收益之間進行合理平衡。
數據管理成為核心競爭力。在互聯網環境中,云處理為大數據提供了彈性可拓展的基礎設備。研究表明,網站、博客、電子郵件、手機等網絡化平臺成為政治態度和價值觀傳播的重要載體。借助大數據與社會行為的關聯度分析,可以充分把握機會窗口開啟的多種觸發因素,政策的決策主體因此能夠迅速作出響應,及時啟動政策的決策流程。數據管理能力直接影響到社情民意調查機構的競爭力。
社情民意數據市場需求潛力巨大。大數據的可獲得性,使市場主體的決策越來越依賴于民意數據,由此必將驅動社情民意調查的空前發展,促進調查機構的市場分工與合作。官方民意調查機構和民辦調查機構將服務于各自的專業市場。旺盛的需求必然推動民意調查供給側的跨越式發展。
四、結論
大數據時代的社情民意調查范圍將進一步拓寬,既可以測量簡單客觀的事項,又可以測量態度等主觀偏好問題,涉及的領域也會擴展,但無論是哪種調查,最終都要服從于受托者,讓調查結果成為決策的重要依據而不是取代決策本身。
誠凱咨詢作為調查機構,一方面會把握大數據為社情民意調查帶來的機遇,主動適應大數據發展的要求,從思維方式、調查設計、技術手段、數據管理到提煉結果等方面實現全面升級;另一方面,也會意識到大數據技術作為一種工具,不可能全面取代其他民意調查的方式,仍需要保持質疑和審慎的態度。