發布時間:2023-06-04 09:45:26
序言:寫作是分享個人見解和探索未知領域的橋梁,我們為您精選了8篇的數據分析的前景樣本,期待這些樣本能夠為您提供豐富的參考和啟發,請盡情閱讀。
關鍵詞:國庫統計 大數據 分析與預測
一、大數據時代國庫統計分析轉變
(一)樹立大數據思維
“大數據時代預言家”維克托認為:世界的本質就是數據,大數據將開啟一次重大的時代轉型,一直以來所延續的傳統統計分析思想已變得陳舊且落后。國庫統計分析思維應當在大數據背景下加以轉變。一是關于大數據抽樣調查工作的思想。抽樣調查是目前統計分析工作中的重要調查方式,但應該清醒地認識到,傳感器、網絡和數據處理技術,為獲取全局數據提供了可能,抽樣調查方式越來越多的被大數據取代成為必然。二是大數據統計思想:允許數據存在不精確性。縱觀目前的各類數據,一方面,數據來源不斷擴展,另一方面數據處理方法飛速發展,我們應該把重心放在統計分析效率上,而不是一味地追求數據的精確性上。三是大數據相關關系的思想,由驗證因果向尋求關聯轉變。統計分析報告是統計工作的下游產品,對決策的意義常常大于常規報表。大數據的應用,統計分析也將發生轉變,在做好因果分析的基礎上向尋求關聯轉變,原因分析更加精準和深刻,對策建議更具參考價值。
(二)被動統計到主動分析,從人工統計到智能統計
在這樣一個信息爆炸的大數據時代,無論政府機構還是社會公眾都可以通過多種途徑獲取信息,國庫統計分析部門也不例外,更應該變被動為主動,對經濟轉型期的一些重大問題尤其是關系到可持續發展的重要問題,做好數據統計分析,提高發展質量,實現經濟轉型。涂子沛指出人類使用數據的巔峰形式,是通過數據賦予機器“智能”。大數據在包括國庫統計分析中應用的終極形式就是分析智能化。
(三)從事后統計向事前預測轉變
統計分析報告是統計工作的重要產品,完整的進度性常規分析應該包括對未來一定時期數據的預測。但由于小數據和信息量的局限,預測一般很少作為報告的重點,多是在假定發展條件、相關政策不變的情況下對未來情況做出的粗略研判,影響了統計對決策的參考價值。而大數據的核心就是將數學算法與海量的數據有效結合,來預測事情發生的可能性。大數據的廣泛應用,將有利于統計報告實現由單一的事后分析,向注重事前預測轉變。
二、大數據在國庫統計分析全流程應用的探討
當前,大數據浪潮帶來了一場新的革命,面對經濟發展的新形勢新要求,國庫統計分析要學會積極的運用大數據的思想和方法,來應對各種新挑戰。國庫統計分析要積極主動建立大數據分析應用機制,破解新常態下面對的各種問題,實現工作的創新與發展。本文重點分析國庫統計分析全流程下大數據的應用。
(一)數據源:建立國庫統計分析數據池
目前國庫統計分析所用數據主要通過“3T”系統產生基礎數據和監管類數據,通過收集各類型政策文件、影像資料、領導講話、內網信息等形成綜合性數據。但這些數據遠未達到支撐大數據統計分析的基礎。國庫統計分析應當建立“數據池”這一基礎工程,通過人行內部數據整合、銀行和其它機構數據接入、互聯網數據抓取和引入等多渠道擴充基礎信息源和數據庫,為國庫統計分析的大數據應用奠定數據基礎。
一是加速整合現有國庫數據。我國國庫匯集了各級政府財務數據和各級國庫管理數據,包括從中央到縣鄉的各級機構化和非結構化數據,也包括稅務、海關、財政、銀行等部門處理的各類收支退存等國庫資金運行數據,涵蓋面極廣。但現有數據資源存在著部門隸屬、無法共享等問題,大數據要求建立統一、高效、共享的國庫業務大數據池,就必須打破現有藩籬,盡早實施“國家金庫工程”,完善內部數據源。
二是擴大國庫統計分析數據源。最重要的是打通各級政府及其下屬各部門之間的數據傳輸通道,實現政府辦公、工商行政、招商引資、外貿出口、仲裁訴訟等政府活動所產生的數據接入共享。其次是實現一行三會、商業銀行、行業協會、企業實體等生產運營數據的持續傳輸和報送。最后是互聯網數據,互聯網是大數據的重要載體,也是數據收集的快捷途徑,通過各類互聯網平臺,門戶以及行業網站,可以收集海量數據來增加國庫統計分析領域數據采集的前置性和時效性。
(二)數據采集與存儲:軟件與硬件結合
大數據的應用中,由于數據來源非常廣泛且類型多樣化,需要存儲和分析挖掘的數據量也是十分龐大的,因此數據展現和處理的高效性以及可用性十分重要。因而,大數據的收集和存儲應當通過先進的計算機技術自動實現,并結合線下需求采取人工收集等傳統方法,以補足系統無法收集的數據的遺漏。國庫統計分析數據的采集應當在國庫大數據資源池基礎上,通過構建云計算應用平臺,統籌整合各直屬國庫大量分散的數據和軟硬件資源,通過應用云計算平臺的資源和功能,以提升和優化整體效能,從而實現全國國庫統計分析的大集成、大整合以及大應用。對于其他橫向聯網數據,比如一些保密性較強的科學研究數據和企業生產經營數據,則可以與研究機構和企業建立合作關系,使用特定系統接口等相關方式采集數據。
在數據存儲方面,在通過完善的物理存儲技術和云計算平臺等軟硬件設施的基礎上,按國庫統計層級建立分級倉儲式數據中心,以人行總行為總庫,各項業務與非業務數據達到匯總存儲,各級行通過內部接口或云計算平臺實現數據上傳下載,同時本級行建立分中心數據存儲倉,采集本級區域內縱向和橫向數據并存儲。同時按照保密和信息安全等要求,實施分級授權和設置防火墻、實時加密存儲數據和卷標存儲加密等技術。
(三)數據清洗與結構化處理
國庫海量的、不規則的數據無法提供有效決策支持,只有通過數據清洗技術將大數據轉變為結構化和規則化的數據,才能體現大數據價值。數據清洗包括檢查數據一致性,處理無效值和缺失值等,是發現并糾正數據文件中可識別的錯誤的最后一道程序。經過數據清洗技術處理殘缺數據、錯誤數據和重復數據后將有效數據寫入數據庫。
在國庫大數據統計分析上,通過數學知識(概率、統計、離散化等)建立合理模型,充分利用和挖掘數據內容。綜合運用開源類和非開源類數據分析工具包括R、Python、MATLAB、SPSS、EVIEWS等軟件進行數據分析。具體實現統計分析、數據挖掘和模型預測等功能,并以可視化的結果予以呈現。統計分析包含假設檢驗、差異分析、相關分析、方差分析、回歸分析、logistic回歸分析、因子分析、聚類分析、主成分分析、判別分析、bootstrap技術等。數據挖掘包含相關性分組或關聯規則、聚類、描述和可視化、復雜數據類型挖掘等。模型預測包含預測模型、機器學習、建模仿真等。
在統計分析過程中,國庫統計分析應該重點實現云應用的創新與共享。統計人員可以根據業務的新要求,在云平臺數據開放接口的基礎上,自由構建合理的數學模型和算法,實現業務應用的創新和擴展。與此同時,以算法的方式將統計人員的智力成果和業務知識固化,當經驗證為可信任應用時,可自動進入云平臺的應用共享庫,在得到授權的前提下,自由使用或補充完善,實現知識固化、資源共享。
(四)國庫運行智能化統計分析
在云應用平臺上,國庫統計分析首先要將日、旬、月和年作為數據的時間維度,將國庫收入、國庫支出以及國庫庫存等統計指標作為數據的為空間維度,利用云計算的強大能力,并借助數據分析展示工具,預先計算處理數據。或者根據用戶事先提交的數據挖掘需求自動完成相關數據預處理。統計分析人員隨時可以從兩個維度上深度挖掘數據,并使用QLikView等數據分析工具,實現統計大數據的多維度、可視化展示。
二是實現常規統計分析的智能化生產。可以通過完善和豐富大數據應用平臺的分析功能,實現機器式的學習,輸入必要的參數后,系統將自動計算數據,并關聯提取大數據池中的相關數據和信息,進而依據特定的模板輸出分析報告,最后由分析人員對輸出的分析報告進行質量把關和進一步的補充完善。
三是構建統計分析數據模型,提高預警預測水平。不斷進行新的分析預測數學模型的探索和構建,充分利用國庫統計大數據平臺上的海量數據和動態實時數據,不斷提高預測水平。
(五)數據展示與反饋
以智能化統計分析為主的大數據應用技術,為數據結構化和可視化的展示提供了支持。簡要國庫運行數據、系統化運行指標、國庫資金運行報告、國情和輿情監測報告、企業和金融服務報告、國庫運行情況預測等為中央銀行、各級政府部門制定有關政策提供統計信息和參考依據,充分發揮國庫在國家預算執行中的促進、反映和監督作用。同時建立信息反饋機制,對現有統計分析結果予以反饋,還包括對未滿足需求提出反饋,豐富和完善大數據應用成果,充分發揮國庫統計分析應用大數據的社會價值。
綜上所述,從全流程看,大數據應用自數據端建立“”數據池“”到處理端智能分析在到應用端數據展示,大致可以通過下圖(圖1)形象展示:
三、有效提升大數據應用的政策建議
(一)從制度層面保障大數據統計分析的有效開展
制定專門的大數據應用法律法規,在由總行統一部署、統一實施的基礎上,各地區分支機構結合當地實際制定特色大數據應用和發展規章制度。從數據產生、采集、存儲、挖掘和應用等大數據處理全流程做出明確安排。一是通過總行層面的發文、通知等鼓勵通過大數據方法加強國庫統計分析,建設大數據共享和應用平臺;二是強化大數據統計所需軟硬件采購、數據源互聯互通及模塊化分割等作出具體安排;三是要求大數據應用所應達到的在信息、統計報告、預測與預警等功能上的目標和績效予以明確,充分利用大數據平臺提供統計分析支持;四是強化信息技術安全,防止信息泄露、網絡攻擊、系統失靈等問題,明確應急處置方案。做到嚴格立法,有法可依,有章可循。
(二)加大基礎設施建設和人才投入,滿足大數據應用的軟硬件要求
大數據基礎設施可分為硬件和軟件兩類。硬基礎設施主要包括用于收集、存儲、分析和應用大數據的信息化系統架構;軟件基礎設施主要包括各類數據信息、數據挖掘和大數據應用專業軟件以及金融企業的人力資源。人民銀行應通過專項資金投入等方式構建大數據應用的軟硬件設施和和培養專業人才,并通過持續培訓使全體員工了解并使用大數據進行國庫統計分析。也可邀請專業的大數據解決方案服務商作為咨詢顧問,整合國庫不同生產系統數據,優化數據應用行為,加快統計系統建設步伐。
(三)提高大數據管理和應用能力
國庫統計分析應不斷的加強國庫運行數據的采集、儲存、保護和管理工作,不斷提升統計分析水平。加強對國庫統計分析中涉及的地方債、營改增、房地產、小微企業經營、財政專戶、盤活庫存等熱點領域可以設計建立相應跟蹤監測指標體系。與此同時加強改革數據的統計制度、方法以及程序,研究大數據共享制度,為宏觀經濟分析提供便捷、堅實的大數據基礎。
建立國庫大數據分析應用機制是新形勢下的當務之急。國庫統計分析需不斷改革創新,強化大數據的思維,提高大數據的意識和駕馭大數據的能力,積極探索新的大數據應用方法和途徑,從而在國家宏觀決策、服務經濟社會發展、服務國庫管理方面,進一步提升國庫統計分析服務的能力和水平。
參考文獻:
[1]沈昱池.大數據時代我國財政信息共享的思考[J].地方財政研究,2015(11):47-67
[2]陳健慧,趙昕.國庫統計分析數據集中系統建設[J].金融電子化,2010,03:89-90
【關鍵詞】胃鏡檢查;焦慮恐懼情緒;原因分析;護理對策
隨著我國人口不斷向老齡化方向發展,需要接受胃腸鏡檢查的人越來越多,受檢病人的條件限制日漸放寬。電子胃鏡檢查是診斷胃病最直觀的檢查方法,也是目前診斷食管、胃和十二指腸疾病最為可靠的方法。胃鏡檢查具有一定的痛苦,而且麻醉具有一定的風險,患者易產生焦慮恐懼情緒[1]。這種不良情緒嚴重影響了胃鏡檢查術的成功率,因此分析患者恐懼焦慮產生的原因并給予相應的對策細致護理是十分必要的。本文分析了2012年6月――2013年6月間為110例患者胃鏡檢查術患者焦慮恐懼產生原因,并給予針對性的護理措施,患者焦慮恐懼情緒明顯緩解,效果良好,現作如下報告。
1資料與方法
1.1一般資料選擇2012年6月――2013年6月我院收治具有不同程度的消化道癥狀、需要胃鏡檢查的患者110例為研究對象,其中男性患者57例,女性患者53例。年齡分布在15-87歲(35.26±6.25)歲,110例均無胃鏡禁忌證。
1.2調查方法采用自擬調查問卷調查表分析患者的基本情況,內容包括性別、年齡、教育程度、家庭狀況、經濟條件、家庭支持、疾病認知程度、胃鏡檢查知識、可能出現的并發癥、費用支付方式、護理質量;采用SAS自評量表[2]評估患者焦慮情緒,分1、2、3、4四個等級,分別賦分4、3、2、1分,分值越高,各項分相加后乘以1.25取整數為標準分,分值越高,焦慮程度越厲害。
指定專職調查者對已簽署胃鏡檢查知情同意書的患者進行了調查,年齡小的患者由家長替代調查。
1.3數據處理所有資料經確認有效后存入Execl數據庫,采用SPSS13.0軟件對數據進行統計分析,計數資料用頻數(n)或率(%)表示,采用卡方檢驗,檢驗標準:P
2結果
通過對SAS數據分析,SAS平均分>50分的為67分,表明110名胃鏡檢查術前患者中有67名患者均有焦慮恐懼情緒,仔細分析67名患者在性別、文化程度、經濟狀況、付費方式、疾病認知程度、胃鏡檢查知識、社會家庭支持滿意度、護理干預質量滿意度方面差異,表明:女性、高中(含中專)、家庭人均月收入
3討論
3.1焦慮恐懼情緒原因分析胃鏡檢查是一種刺激性檢查,能夠引起人體不同的應激反應,包括生理上的應激反應和心理上的應激反應,生理上主要表現為惡心、嘔吐、血壓及脈搏的變化,心理上表現出情緒焦慮、恐懼等,兩種反應相互作用,又增加了復合應激反應[3]。本文研究表明,女性(69.81%)所表現出的焦慮恐懼情緒明顯高于男性(52.63%),這可以從男女承受應激反應方面得到解釋。
進一步分析可以看出,不同文化程度、不同經濟狀況、不同付費方式的人群胃鏡檢查前所表現出的焦慮恐懼程度也不相同,初中文化以下文化程度與大專以上文化程度明顯低于高中(含中專)文化程度,家庭人均月經濟收入>3000明顯低于3000以下的人群,自費人群明顯高于公費及醫院保險受益人群。比較分析好像有些矛盾,可能與初中以下文化程度大多生活在社會底層,抗擊打能力較強有差。
從對疾病知識的認識程度、對胃鏡檢查及可能誘發并發癥的了解程度、社會家庭支持滿意度、護理質量滿意度分析,可以看出了解得越深入、滿意度越高,患者產生焦慮恐懼情緒的比例就會越低,國外學者從不同的角度研究的觀點都支持這個結論[4-5]。
3.2護理對策構建全方位的社會家庭支持網絡:胃鏡檢查患者因角色的轉換,急需社會家庭的關心支持。護理人員要反復向家屬宣講家屬陪伴對患者病情康復的作用,同時對于多次胃鏡檢查沒有確診的患者,要盡可能地滿足患者家屬陪檢的要求。對于自費的患者,要注意溝通的方式方法,避免方法失當可加重患者焦慮恐懼情緒[6]。
加強健康宣教,提高患者對疾病與胃鏡檢查的認知水平。可采取發放宣傳小手冊、播放資料、或者是一對一個案教育等形式,告知胃鏡檢查的過程、方法、可能發生的不良反應,以期讓患者獲得更多的認知,從而減輕或消除焦慮恐懼情緒,增強治療的依從性。
提高護理質量,增強服務意識。本文研究表明患者的焦慮恐懼情緒與患者對護理質量的滿意度呈正相關性,這與有些研究不盡相同,但可以肯定的是,護理質量的優劣、服務態度的好壞對患者心理是有影響的[7]。因此護理人員要熟悉胃鏡檢查護理流程,主動熱情微笑服務,以構建良好的護患關系。
綜上所述,胃鏡檢查術前患者產生焦慮原因影響因素很多,性別、文化程度、經濟狀況、付費方式、對疾病的認識程度、對胃鏡檢查及可能產生并發癥的了解程度、對社會家庭支持及護理質量的滿意度均可對術前檢查焦慮恐懼情緒產生影響。護理人員應分析原因,構建全方位的社會家庭支持網絡,加強健康宣教,提高患者對疾病與胃鏡檢查的認知水平,提高護理質量,增強服務意識,從而達到有效化解或減輕患者焦慮恐懼情緒的目的。
參考文獻
[1]姚菊英,高春紅.膝關節鏡手術病人的康復護理[J].護理學雜志,2002,17(2):150-151.
[2]汪向東,王希林,馬弘.心理衛生評定量表手冊[J].中國心理衛生雜志,1999,12(增刊):253-256.
[3]滕云.胃鏡檢查前患者焦慮的護理體會[J].中國醫藥指南,2012,10(28):301-302.
[4]張凌燕,王艷玲.初次胃鏡與多次胃鏡檢查患者焦慮狀況分析[J].中華現代護理雜志,2009,15(7):630-631.
[5]Zaman A,Hahn M,Hapke R,et al.A randomized trial of perorlavesus transnasal unsedated endoscopy using an ultrathim videoenodscope[J].Gastrointest Endosc,1999,49:279-84.
關鍵詞:大數據分析 新聞深化報道 應用研究
大數據分析如今已經觸及到了社會生活的各個領域,近些年來的全國兩會就是典型代表,新聞報道中應用大數據分析,使得新聞報道更加具有說服力。通過大數據分析,新聞報道能夠挖掘潛在新聞元素,發現新聞事件中的邏輯規律,從而豐富新聞報道的內涵,讀者也能夠對新聞事件作出更加理性的判斷。可是,大數據分析究竟是什么?大數據分析在深化新聞報道中又是如何體現的呢?筆者將對有關內容作進一步研究。
一、大數據的基本概念
最早提出“大數據時代”概念的是美國的麥肯錫公司,在對大數據進行定義的時候,麥肯錫研究所是這樣理解的:大數據是相對于傳統數據而言的一個概念,指的是依靠傳統的數據庫軟件或者工具難以抓取、存儲、管理和分析的數據群。與麥肯錫研究所不同的是,百度百科給大數據下定義的時候是這樣描述的:大數據又稱為巨量資料,由于大數據涵蓋的資料規模龐大,利用當前主流的數據軟件或者工具在一定的時間內無法達到擷取、管理、處理并整理成為更加積極的幫助企業或者組織進行經營管理決策的資訊。無論是何種定義,都認為大數據已經超出了傳統的數據庫軟件或者工具的能力范圍,大數據具有大量、高速、多樣、價值高等特點。
二、大數據分析在深化新聞報道中的應用
(一)尋找準確的切入角度
大數據分析應用在新聞報道中,能夠幫助新聞工作者找準新聞事件的切入點。新聞行業是數據的重要應用者,通過數據分析,能夠將原本分散、瑣碎的數據呈現出一定的邏輯規律,使得新聞報道的切入點更好把握,從而讓新聞工作者能夠對新聞熱點進行深度解讀。比如,在報道全國兩會的時候,很多老百姓關心的問題,如果通過大量的文字進行描述,可能會讓老百姓感覺過于形式化,新聞報道中通過大數據分析,切入點找準之后,能夠和老百姓產生共鳴,引起的社會關注度也更高。
(二)加強新聞報道的深度
以往,新聞工作者在進行新聞報道的時候,要想獲得相關的數據只能夠通過電話聯系的方式經過有關部門的同意之后才能夠實現,整個程序下來非常繁瑣,并且獲取的數據并不一定能夠真實反映數據背后的意義。但是,和以往大不相同的是,網絡的存在使得世界各國的數據觸手可及,新聞報道中大數據分析的應用,可以最大限度地提升新聞報道的深度。例如,前些年有一則科技類的新聞,標題是“聯想超越惠普,成為全球第一大個人電腦廠商”。面對這樣一則新聞,為了能夠讓讀者更加信服,彭博新聞社應用大數據分析進行了深度剖析,以2004年聯想和IBM簽訂合同作為起點,對比分析了世界范圍內的五大個人電腦生產商的股價變化,其中就利用到了大數據,通過數據對比,有力地說明了聯想這在八年內市場份額的不斷擴大,從而實現了對惠普的趕超。新聞中的大量數字的出現,很好的解決了質疑者的疑問,而這樣一個實例也恰恰顯示了大數據分析應用在新聞報道中能夠使得報道更具深度。
(三)創新新聞報道視角
大數據分析應用在新聞報道中能夠給新聞報道提供更具特色的報道視角。曾經在《兩會大數據》節目中有人提出過這樣一個問題:中國“兩會”的召開,在哪個國家的關注度更高?以往,面對這樣一個問題很難解答,即使能夠作出回應也只能通過諸如《全球高度關注中國兩會》這樣的報道中尋找答案,而這樣的答案通常都是含糊不清的。然而,借助《兩會大數據》欄目,能夠合理地對全球其他國家對“兩會”的關注度進行排名,得出的結果將會更加具有說服力。通過對全球將近90個國家的網民對“兩會”新聞的瀏覽、評論的數據,經過數據分析,可以客觀公正地顯示出關注“兩會”的熱點區域,使得國人對國外民眾如何看待“兩會”的問題的答案從模糊變得明確,而這都是利用大數據分析實現的。
(四)s短報道響應的時間
大數據時代,新聞工作者能夠更加快速地收集數據、分析數據、選取數據,然后形成相應的新聞報道,為受眾提供及時的新聞資訊。不管是關系百姓日常出行的天氣預報,還是各種網絡熱點新聞,大數據分析的應用,可以在最短的時間內對問題進行解讀分析,受眾可以不出家門就能夠及時了解到世界各地的新聞資訊,大數據極大地縮短了新聞報道響應的時間。新聞報道具有客觀性,也具有時效性,對于新聞工作者而言,如何第一時間將新聞報道出來以此吸引更多讀者前來閱讀是他們每天必須考慮的事情。大數據分析的應用,采用最新技術和方法來加速相應的時間,這樣就使得掌握大數據分析報道方法的機構能夠掌握最佳的報道實際,不但節約了大量成本,還獲取了海量的關注,新聞報道的實效性更強,新聞事業的發展也將更進一步。
三、結語
網絡時代背景下,我們不可避免地將同各式各樣的數據產生接觸,大數據不但改變了我們的思維方式,還該變了我們的生產方式,更加改變了我們的生活方式。大數據分析的應用,使得新聞報道更加具有深度的同時,它的時效性也大大增強。期待在大數據背景下,新聞報道能夠借助大數據分析實現更好的發展。
參考文獻:
[1]程潔.大數據分析在深化新聞報道中的應用[J].新聞愛好者,2014,(07).
[2]胡艷.數據可視化在新聞報道中的應用前景探析[J].西南民族大學學報(自然科學版),2014,(05).
關鍵詞:組合預測方法 旅游經濟 數據分析預測
現階段,國家對旅游行業的投資顯著增加,旅游經濟成份發展也呈現出多元化趨勢,投資格局也漸趨多元,旅游業“政府主導、社會參與、市場運作”的發展模式發展應用也漸趨成熟。但是旅游行業的發展過程中面臨著環境、經濟政策等各項影響因素,需要構建有效的發展模式,全面提升經濟發展科學化與系統化水平。本文著重分析了組合預測方法在旅游經濟分析預測中的創新應用。
一、旅游經濟發展現狀概述
近年來,我國旅游行業的發展呈現出資源特色化與旅游需求多元化的特點,基于此發展趨勢,國家注重進行了特色化、綜合化旅游資源開發,為旅游行業的發展注入了新生機。伴隨著旅游資源的開發,旅游經濟網絡不斷升級完善,但是有些地方的旅游經濟指標仍然存在不科學現象,還有些地方旅游經濟發展相關機制并不健全,直接影響了旅游經濟行業現狀分析與前景預測工作的開展,間接導致了旅游經濟目標的實現,嚴重不利于區域的協調發展。
此外,有些地方的旅游經濟發展進展方式不科學,主要表現在旅游資源的開發過程中忽視環境生態指標的落實,直接降低了地區旅游資源開發過程中生態效益的實現,由此可見,健全旅游行業的組合預算模式進行旅游經濟現狀分析與前景預測具有必要性與緊迫性。
二、組合模型研究與應用
現階段,旅游經濟行業預測方法多樣,但是受多種因素的影響,使用單一的經濟預測方式具有一定的局限性,旅游行業發展受多元化因素的影響,因此行業經濟預測方法應該囊括旅游行業多元因素的實際情況,并能進行綜合化的預測評估,并全面提升旅游行業經濟工作的科學化水平。基于這種方法需求,眾多學者主張將組合預測分析法應用于旅游經濟分析預測中,該方式采用模型預測模式能夠全面、系統的推進旅游經濟預測分析工作的進展。
(一)單項預測模型構建
現階段,旅游經濟行業分析預測工作中應用的模型主要有指數平滑模型、ADL回歸分布滯后模型及局部多項式估計模型三種,其中前兩種應用比較廣泛,并且模型構建過程中具有一定的技術要點。
1、指數平滑模型
指數平滑模型的構建是基于指數平滑法組建的模型,又叫作指數修勻,具有進行數據自動跟蹤的功用,因此在短期經濟趨勢預測方面應用廣泛。指數平滑模型應用于旅游經濟數據預測中能夠減弱數據過大波動,可以進行有效的短期趨勢預測。
指數平滑模型進行數據波動處理時會綜合應用各種方法,這樣能夠有效避免數據處理的滯后性,能及時捕捉到數據的動態更新,具有廣泛的應用價值。
2、ADL模型
ADL模型基于經濟預測理論與數據信息處理結合基礎,能夠處理變量數據并總結出變量中穩定關系的應用模型,該模型主要應用于經濟變量參數闡述,并進行數據統計與診斷檢驗,因此在旅游經濟參數確定中具有利用價值。但是該模型在應用中一旦丟失解釋變量將會直接導致模型應用偏差,因此要注意該模型應用中的解釋變量的保存。
此外,ADL模型應用中的參數估計是其重要環節。傳統的該模型應用中常考慮國際旅游外匯收入,現階段應用比較廣泛的模型將入境過夜旅游人數作為變量算入模型,有效提升了模型得出的回歸參數的有效性。而且新模型應用中還進行了模型檢驗與優化,尤其是進行了自相關性LM檢驗與Wald系數檢驗,全面減少了模型應用的約束因素。
(二)組合預測模型參數估計預測
組合預測法是綜合多種預測方法與模型設計進行經濟數據分析與預測的新型方法,主要分為線性組合預測與非線性組合預測兩種。組合預測法具有較高的預測精度。在預測實踐中,采用不同的預測方法會得出不同的數據結果,這與其中的參數估計與預測有關。
組合預測模型中的參數估計與預測環節中比較重要的是各單項預測中加權系數的選取,應用比較廣泛的是誤差平方和最小的方法。現階段,參數估計與預測中構建了誤差評價指標體系,其中著重就加權系數應用有效性規定了評價標準,并分七種情況進行了預測效果羅列,這樣應用該預測方法進行數據分析能夠較低風險性。
三、旅游經濟前景預測應用
將組合預測法應用于旅游經濟數據處理領域能夠有效強化旅游行業的數據統計,為旅游行業發展提供科學指導,尤其是應用于旅游經濟前景預測環節。
將組合預測法應用于旅游經濟數據分析預測中可以為經濟調控與經營方式的改進提供指導,因此該法在旅游經濟發展前景中應用將會越加廣泛。
四、結束語
本文著重分析了組合預測分析法在旅游經濟分析預測中的應用,筆者認為將該技術應用于旅游經濟分析中能夠進行經濟前景預測,其應用具有重大的戰略意義。強化組合預測模型構建,并精確模型參數,對于提升組合預測法應用價值意義重大。
參考文獻:
[1]雷可為,方田紅.基于組合模型的陜西省旅游市場需求預測[J].西北師范大學學報(自然科學版),2009(03)
云計算、大數據浪潮的一個表現是,IT市場從“以計算為中心”向“以數據為中心”轉變。以IDC的2012年第三季度市場分析數據為例,外部存儲市場增長3.3%,服務器市場卻下降4%。這是因為,云計算讓廉價的X86服務器可以擔當重任,“計算”的門檻便降低了。
“數據”方面的情況則是,數據量飛速增長。最近,IDC了2012數字宇宙研究報告,報告調高了對數字宇宙增長速度的預測。2010年,IDC預測到2020年,數字宇宙的規模為35ZB。在最新的報告中,這一數字變為40ZB。
2013年,我們還將看到,云計算、大數據浪潮正在引發IT廠商格局的巨變。思科公司董事長錢伯斯最近做出預言,微軟、IBM、惠普、SAP、甲骨文和思科等科技巨頭,5年內將有兩家或3家不在名單之列。同時,EMC、VMware進一步提出軟件定義數據中心的理念,將云計算的變革推向深入。
在IT產業中,EMC公司的規模并不算很大。2012年銷售收入預測為216億美元~217.5億美元,而它在IT業界的地位超過了很多規模大的公司。EMC之所以能夠引領云計算、大數據潮流,是因為公司決策層能夠敏銳地洞悉行業技術趨勢,從產品、技術和解決方案上提前布局。
最近,EMC公司全球11位高管從技術的角度,對2013年全球技術趨勢進行了預測。這11位高管分別來自信息安全、信息智能、企業存儲、閃存產品、備份恢復、大數據分析等部門。他們認為云基礎架構和大數據分析處理的最新需求趨勢是:
由于軟件智能、跨域基礎架構管理軟件包以及對象存儲開放接口技術的廣泛采用,混合云模式將變成現實;
大數據存儲將催生新型應用,IT創新和變化的速度加快;
提供單點式工具的大數據初創公司前景不樂觀,客戶需要集成式解決方案;
信息安全需要基于大數據分析的深度防御戰略;
企業級存儲將更多采用行業標準組件、企業級閃存和領先的驅動器技術;
閃存將成為常態產品,相變存儲器將迎來投資熱潮;
統一存儲方面,從服務器、網絡到存儲,將普遍采用閃存技術;
“重復數據刪除技術+磁盤備份”的模式將進一步替代磁帶備份,備份恢復朝著“IT即服務”方向發展;
企業內容管理方面,基于云服務模式、以內容為中心的解決方案將達到質變點;
由于人們越來越多地采用云和大數據,企業在IT改造中,人、流程和技術的重要性凸顯。
【關鍵詞】信息化系統 高速公路 交通數據分析 應用
一、前言
信息管理系統在高速公路交通數據分析中發揮著重要的作用,它不僅減輕了人工數據統計的體力支出和成本支出,同時也能夠較好的適應高速公路運營的出現的新情況和新問題,并能夠利用統計分析的原理加以剖析,為高速公路建設和管理的科學化提供良好的借鑒性意義,以更好保證高速公路運營的正常性,創造更多的企業效益,為經濟社會的發展提供較為穩定的基礎設施。信息管理系統廣泛應用于高速公路交通數據分析過程中,并且在高速公路交通數據分析過程中發揮著越來越重要的作用已成為一項不爭的事實,各國都注重了信息管理系統在高速公路交通數據分析中的作用,采取多種方式加以研究,力求發揮信息管理系統在高速公路交通數據分析中作用的最大化。
二、信息管理系統
作為信息管理系統是一種操縱和管理數據庫的大型軟件,用于建立、使用和維護數據庫。用戶通過訪問數據庫中的數據,數據庫管理員也進行數據庫的維護工作。它可使多個應用程序和用戶用不同的方法在同時或不同時刻去建立,修改和詢問數據庫。數據管理系統的應用增強了系統的靈活性,加快了數據分析的速度,從而更好的實現數據分享,將數據分析結果應用于政策制定和實施,從而有效的增強了政策的科學性。
三、將信息管理系統應用于高速公路交通數據分析中的意義
(一)經濟社會發展的迫切需要
伴隨著我國經濟社會的快速發展,交通運輸業也需要緊跟經濟社會發展的步伐,而高速公路的建設和發展對于交通運輸業的發展具有極其重要的意義。將信息管理系統應用于高速公路交通數據分析過程中,綜合我國經濟發展態勢和各地區的經濟發展現狀能夠更好地規劃和設計交通運輸方式,從而更好地推動經濟社會的可持續發展。
(二)高速公路管理科學化的要求
高速公路交通系統中數據分析是重要的基礎性工作。它體現公路交通系統的業務情況以及車流構成、流量、流向等特征,可以為高速公路事業的規劃、建設和管理提供科學依據。隨著我國公路收費系統步入了計算機聯網收費階段,利用高速公路信息管理系統進行高速公路的交通數據分析成為重要手段。高速公路信息管理系統從最初方案設計開始,就充分考慮整個系統的整體性和擴充性,并對高速公路信息管理系統進行合理劃分,從而更好地實現高速公路聯網收費和統一管理,做到路網內行駛一卡通和按路段合理結算,以提高高速公路管理的科學化水平。
四、廣西高速公路信息化系統建設概況
廣西高速公路收費系統是為了滿足對高速公路收費統計查詢以及分配的需要,結合現有的管理機制而分析和設計的,可分為收費管理與清分二個部分。收費管理的目的是通過利用計算機網絡和相應的軟件,并與通訊、監控系統相配合來大幅度提高收費效率以及提高財務核算的安全性和自動化程度,降低工作人員的工作強度。同時最大限度地防止各種營私舞弊現象,提高工作效率,為管理決策層提供各種相關信息。目前高速公路的管理體制,自上向下分為四層的行政管理結構,即聯網清分總中心―收費中心―收費分中心―收費站。
收費站是收費的基層單位。收費車道的原始數據匯總到收費站,收費站監控員進行當班數據的匯總,統計核對收費數據。收費站站務員對收費數據復核,并進行必要的數據糾錯,提供本收費站正確完整的匯總數據。同時收費站的原始數據實時通過TCP/IP協議上傳總中心,匯總數據在站務員輸入的同時也上傳總中心。所以,收費站一級是總中心收費數據的基礎。分中心和中心本地不保存收費數據,它訪問收費站獲得它要的數據。總中心的數據統計、數據查詢和清分是依據收費站上傳的數據。
五、從具體數據看信息管理系統在高速公路交通數據分析中的應用
(一)車流流量統計與分析應用
車流流量統計與分析應用是信息管理系統在高速公路交通數據分析中的一個方面,通過信息管理系統,我們能夠實現對高速公路車流流量統計與分析。下表為某城市路段高峰車流量分析表,見表1:
通過以上分析,我們能夠明確的看出個收費站在高峰和低峰期車流量,及各個時間段的變化和平均小時流量的變化,并根據相關數據合理安排各收費站的工作人員情況,更好的確保交通的暢通性。
(二)車流流向統計與分析應用
車流流量統計與分析應用是信息管理系統在高速公路交通數據分析中的另一個方面,下表是某城市途經A路段的綠色通道車輛流向統計表,見下表:
路段 其他路段站碼 入口車輛數 出口車輛數 合計
A路段
101 108 10782 10890
105 754 137 891
206 43 59 102
501 202 42 244
705 1158 47 1205
803 3330 11520 14850
821 77 933 1010
909 1490 3596 5086
921 2590 3352 5942
999 359 1770 2129
從表格中我們可以清楚掌握途經A路段的綠色通道車輛在全區部分路網中分布和走向情況,為高速公路管理者更清晰地認識高速公路通行費減免情況,并提供精確數據以合理決策。
(三)路段綜合信息車流量統計分析和應用
路段綜合信息車流量統計分析和應用是信息管理系統在高速公路交通數據分析中的又一個方面。下表為兩段高速A、B年度車流量綜合統計分析表:
分析項目 A 路段 B路段 AB高速合計
路段內收費站數量 5 6 11
里程(公里) 72 116 188
拆分所得通行費 16805萬 20854萬 37659萬
收取路段通行費 4693萬 14420萬 19113萬
每公里路段發生的通行費 233萬 180萬 200萬
路段內收費站出入口車流量 1639616 3576253 5215869
日均斷面車流量 5911 8009 6955
通過以上分析,我們得出了兩路段的綜合信息車流量統計分析,透過數據,我們能夠了解到路段通行費,從而實現更好的費用管理。
六、小結
信息管理系統在高速公路交通數據分析中發揮著重要的作用,高速公路交通數據分析是一個較為復雜的過程,以上只是將車流量進行了簡單的統計,交通數據分析還要對通行費、通行卡進行綜合統計。單方面通過某一種交通數據是無法的得出正確的交通數據分析結果,只有通過上述方式將多重數據綜合進行分析,才能得出所需要的結論,為高速公路的管理者和決策者提供正確的分析依據,促進我國交通運輸事業和經濟社會的快速發展。
參考文獻:
[1]段廣云,沈振宇.高速公路交通信息系統實際應用中的若干問題及對策.公路交通技術,2009年,第06期:21-22
本研究報告數據主要采用國家統計數據,海關總署,問卷調查數據,商務部采集數據等數據庫。其中宏觀經濟數據主要來自國家統計局,部分行業統計數據主要來自國家統計局及市場監測數據,企業數據主要來自于國統計局規模企業統計數據庫及證券交易所等,價格數據主要來自于各類市場監測數據庫。
報告目錄:
第一章 計算機行業報告研究標準
第一節 計算機行業研究背景
第二節 計算機行業研究方法及依據
第三節 計算機行業研究基本前景概況
第二章 計算機行業發展綜述
第一節 計算機概念
第二節 計算機行業特征分析
一、計算機作用分析
二、計算機行業在國民經濟中的地位
三、計算機行業生命周期分析
第三節 最近幾年中國行業經濟指標分析
一、贏利性
二、成長速度
三、附加值的提升空間
四、進入壁壘/退出機制
五、風險性
六、行業周期性
七、競爭激烈程度指標
八、行業成熟度分析
第四節 **行業產業鏈及上下游之間關聯性分析
第三章 XX年世界計算機行業市場分析
第一節 XX年世界計算機行業運行環境分析
一、當前經濟環境分析
二、經濟政策對產業的影響
第二節 XX年世界計算機市場競爭現狀分析
第三節 XX年世界部分國家計算機市場分析
一、歐洲地區
二、北美地區
三、亞洲地區
第四節 XX-2019年世界計算機行業新趨勢研究分析
第四章 XX年計算機行業當前發展環境分析
第一節 XX年中國計算機行業經濟環境分析
一、XX年中國宏觀經濟分析
二、XX年中國宏觀經濟發展預測
第二節 中國計算機行業政策法規解讀
第三節 中國計算機行業當前社會環境發展分析
第五章 我國計算機行業運行分析
第一節 我國計算機行業發展狀況分析
一、我國計算機行業發展階段
二、我國計算機行業發展總體概況
三、我國計算機行業發展特點分析
四、我國計算機行業商業模式分析
第二節 XX-XX年計算機行業發展現狀
一、XX-XX年我國計算機行業市場規模
二、XX-XX年我國計算機行業發展分析
三、XX-XX年中國計算機企業發展分析
第三節 區域市場分析
一、區域市場分布總體情況
二、XX-XX年重點省市市場分析
第四節 計算機細分產品市場分析
一、細分產品特色
二、XX-XX年細分產品市場規模及增速
三、重點細分產品市場趨勢分析
第五節 計算機產品價格分析
一、XX-XX年計算機價格走勢
二、影響計算機產品價格的關鍵因素分析
1、成本
2、供需情況
3、關聯產品
4、其他
三、XX-2019年計算機產品價格變化趨勢
四、主要計算機企業價位及價格策略
第六章 XX-XX年中國計算機行業技術發展分析
第一節 中國計算機行業技術發展現狀
第二節 計算機行業技術特點分析
第三節 計算機行業技術發展趨勢分析
第四節 XX年中國計算機行業發展面臨的新挑戰分析
第七章 XX-XX年中國計算機市場運行情況
第一節 行業最新動態分析
一、行業相關動態概述
二、行業發展熱點聚焦
第二節 行業品牌現狀分析
第三節 行業產品市場價格情況
第四節 行業外資進入現狀及對未來市場的威脅
第八章 XX-XX年中國計算機所屬行業主要數據監測分析
第一節 XX-XX年中國計算機所屬行業總體數據分析
一、XX年中國計算機所屬行業全部企業數據分析
二、XX年中國計算機所屬行業全部企業數據分析
三、XX年中國計算機所屬行業全部企業數據分析
第二節 XX-XX年中國計算機所屬行業不同規模企業數據分析
一、XX年中國計算機所屬行業不同規模企業數據分析
二、XX年中國計算機所屬行業不同規模企業數據分析
三、XX年中國計算機所屬行業不同規模企業數據分析
第三節 XX-XX年中國計算機所屬行業不同所有制企業數據分析
一、XX年中國計算機所屬行業不同所有制企業數據分析
一、XX年中國計算機所屬行業不同所有制企業數據分析
一、XX年中國計算機所屬行業不同所有制企業數據分析
第九章 XX-XX年中國計算機行業競爭情況
第一節 行業經濟指標分析
一、贏利性
二、附加值的提升空間
三、進入壁壘/退出機制
四、行業周期
第二節 行業競爭結構分析
一、現有企業間競爭
二、潛在進入者分析
三、替代品威脅分析
四、供應商議價能力
五、客戶議價能力
第三節 行業國際競爭力比較
第十章 XX-XX年計算機行業重點生產企業分析
第一節 a企業
一、企業簡介
二、企業經營數據
三、企業產品分析
第二節 b企業
一、企業簡介
二、企業經營數據
三、企業產品分析
第三節 c企業
一、企業簡介
二、企業經營數據
三、企業產品分析
第四節 d企業
一、企業簡介
二、企業經營數據
三、企業產品分析
第五節 e企業
一、企業簡介
二、企業經營數據
三、企業產品分析
……………
第十一章 XX-2019年計算機行業發展預測分析
第一節 XX-2019年中國計算機行業未來發展預測分析
一、中國計算機行業發展方向及投資機會分析
二、XX-2019年中國計算機行業發展規模分析
三、XX-2019年中國計算機行業發展趨勢分析
第二節 XX-2019年中國計算機行業供需預測
一、XX-2019年中國計算機行業供給預測
二、XX-2019年中國計算機行業需求預測
第三節 XX-2019年中國計算機行業價格走勢分析
第四節 XX-2019年中國**行業盈利水平分析
第十二章 XX-2019年中國計算機行業投資風險預警
第一節 XX-2019年中國**行業投資環境分析
第一節 中國計算機行業存在問題分析
第二節 中國計算機行業政策投資風險
一、政策和體制風險
二、技術發展風險
三、經營管理風險
四、供需波動風險
五、其他風險
第十三章 XX-2019年計算機行業投資機會與風險
第一節 經濟形勢給我國計算機企業帶來的機遇分析
一、為享受調控政策帶來機遇
二、為搞好戰略轉型帶來機遇
三、為吸引國際投資帶來機遇
四、為招聘高端人才帶來機遇
五、為實施戰略重組帶來機遇
六、為降低制造成本帶來機遇
第二節 經濟形勢下計算機行業發展機遇分析
一、經濟形勢為計算機企業提供了并購國外企業的機會
二、經濟形勢導致部分 經營不善的計算機企業退出市場
三、經濟形勢中我國計算機企業發展機遇分析
第三節 計算機企業戰略規劃不確定性風險
一、客觀事件的不確定性風險
二、市場的不確定性風險
三、行業發展的不確定性風險
四、技術發展的不確定性風險
五、戰略規劃者的主觀不確定性風險
六、執行過程的不確定性風險
七、工具方法的局限性風險
八、戰略規劃系統的不確定性風險
第十四章 計算機行業發展戰略研究
第一節 計算機行業發展戰略研究
一、技術開發戰略
二、產業戰略規劃
三、業務組合戰略
四、營銷戰略規劃
五、區域戰略規劃
六、企業信息化戰略規劃
第二節 計算機行業品牌戰略分析
一、品牌的基本含義
二、品牌戰略在企業發展中的重要性
三、計算機品牌的特性和作用
四、計算機品牌的價值戰略
五、我國計算機品牌競爭趨勢
六、計算機企業品牌發展戰略
七、計算機行業品牌競爭策略
第三節 計算機企業經營管理策略
一、企業經營策略綜述
二、企業產品經營策略
三、企業渠道經營策略
四、企業并購策略分析
五、當前形勢下企業經營管理策略
圖表目錄:
圖表:國內生產總值同比增長速度
圖表:全國計算機產量及其增速
圖表:規模以上工業增加值增速(月度同比)(%)
圖表:社會消費品零售總額增速(月度同比)(%)
圖表:進出口總額(億美元)
圖表:廣義貨幣(m2)增長速度(%)
圖表:居民消費價格同比上漲情況
圖表:工業生產者出廠價格同比上漲情況(%)
圖表:城鎮居民人均可支配收入實際增長速度(%)
圖表:農村居民人均收入實際增長速度
圖表:人口及其自然增長率變化情況
圖表:XX年固定資產投資(不含農戶)同比增速(%)
圖表:XX年房地產開發投資同比增速(%)
圖表:XX年中國gdp增長預測
圖表:國內外知名機構對XX年中國gdp增速預測
圖表:計算機行業產業鏈
圖表:XX-XX年計算機行業市場供給
圖表:XX-XX年計算機行業市場需求
圖表:XX-XX年計算機行業市場規模
圖表:XX年中國計算機所屬行業全部企業數據分析
圖表:XX年中國計算機所屬行業全部企業數據分析
圖表:XX年中國計算機所屬行業全部企業數據分析
圖表:XX年中國計算機所屬行業不同規模企業數據分析
圖表:XX年中國計算機所屬行業不同規模企業數據分析
圖表:XX年中國計算機所屬行業不同規模企業數據分析
圖表:XX年中國計算機所屬行業不同所有制企業數據分析
圖表:XX年中國計算機所屬行業不同所有制企業數據分析
圖表:XX年中國計算機所屬行業不同所有制企業數據分析
圖表:計算機所屬行業生命周期判斷
圖表:計算機所屬行業區域市場分布情況
圖表:XX-2019年中國計算機行業市場規模預測
圖表:XX-2019年中國計算機行業供給預測
圖表:XX-2019年中國計算機行業需求預測
[關鍵詞]大數據;預測精度;數據挖掘;自適應;數據質量
doi:10.3969/j.issn.1673 - 0194.2017.02.031
[中圖分類號]F273 [文獻標識碼]A [文章編號]1673-0194(2017)02-00-07
1 大數據時代對煙草行業的影響
大數據應用于煙草信息研發,能使煙草行業充分了解、及時掌握當今世界的煙草信息,有效調整煙草戰略、市場決策,使行業立于不敗之地。
凌成興在2014年全國煙草工作會議上提出煙草行業要深入思考、積極謀劃、努力實踐“三大課題”,即深入思考、積極謀劃、努力實踐改革的紅利在哪里?發展的潛力在哪里?追趕的目標在哪里?這是我國煙草行業今后一段時期內努力發展的方向和奮斗的目標。
煙草企業借助大數據研發應用的分析,可以隨時掌握世界新的煙草信息,捕捉其技術要領,了解其發展的先進性與適應性,并為我所用,從而可以積極有效地推動我國煙草行業的發展,促進“三大課題”的努力實踐和圓滿成功,為我國煙草行業快速、高效地發展提供堅實的信息技術后盾,奠定快速、高效發展的堅實基礎。第一,它可以進一步優化煙草市場的資源配置,建立統一開放、競爭有序的市場體系,創造和釋放煙草改革的紅利空間。因為大數據的研發應用本身就是一次全新的信息技術改革。第二,它能不斷地挖掘結構調整、國際市場、貨幣資金保值增值所蘊藏的發展潛能,努力實現煙草“十三五”的奮斗目標。第三,它能早日實現我國追趕煙草跨國公司前三名、煙機制造公司的“排頭兵”、原材料與輔助材料生產的大集團的新目恕⑿呂硐搿⑿亂求,實現中國煙草行業進入新的發展格局的目標。
大數據的應用分析,是當今信息時代又一次全新的、更高的、更龐大的與更復雜的信息化技術革命。它對提高現代經濟分析能力和管理水平、提高一個行業或一個單位的準確決策和經濟實力的能力,有著不可估量的積極作用,蘊藏著巨大的潛力和能量。
2 煙草制造過程中大數據工藝管控和常規數理統計工藝管控的差異分析
現階段行業內卷煙廠工藝管控主要以常規數理統計算法為主,輔助以信息化的手段實現預警控制。例如上海卷煙廠通過加入SPC對應的判異準則,固化至信息化系統中,創新地提出了SPCD的管控方法。青島卷煙廠通過將6 sigma分析的指標權重納入信息化實時預警管控分析,創新性地提出了卷煙制造過程能力信息化預警分析的管控方法。迄今為止,煙草行業內還沒有卷煙廠實現了以大數據算法為核心的工藝管控實例,即通過大數據分析方法全面補充和完善常規數理統計的短板,實現工藝智能化管控水平的螺旋式上升。本文將從四個方面對大數據分析與常規數理統計在工藝管控層面的差異進行對比,旨在全面凸顯大數據分析的優勢,進而對煙草制造過程中信息化工藝管控的前景進行探索。
2.1 預測精度對比
大數據預測有別于常規數理統計的回歸分析,常規數理統計的回歸分析是建立在數據均滿足正態性和樣本獨立性兩個條件為前提的,同時在回歸過程中要通過逐步回歸剔除對應的異常點,方能進行回歸算法的計算。而大數據預測則無需這些條件的限制,可直接根據特征樣本進行訓練,直接得出對應的預測結果。
2.1.1 常規數理統計分析
以某卷煙廠烘絲出口水分為例進行說明。
對影響烘絲出口水分對應的過程參數建立對應的回歸方程表如表1所示。
由圖1可以看出,葉絲冷卻出料含水率的四合一殘差圖以及各自變量殘差圖分布均勻,滿足齊次、正態等特點。
根據回歸方程對測試集數據進行預測,如表4所示。
將預測值與真實值進行偏差計算,如表5所示。
2.1.2 大數據分析
首先,對影響烘絲出口水分對應的過程參數建立隨機樹模型,如圖2所示。
從圖2中可以看出,參數4離線程度最大,因此參數4重要度最高,根據離線度得出其參數重要性排序為參數4(葉絲干燥出料含水率)>參數1(葉絲干燥Ⅰ區筒壁溫度)>參數2(葉絲干燥Ⅱ區筒壁溫度)>參數3(葉絲干燥熱風溫度)>參數5(葉絲干燥出料溫度)。
再進行決策樹分析,根據決策樹得出如下對應的過程參數與關鍵質量特性二叉樹(如圖3所示)。
然后根據隨機樹運算結果進行預測,如表6所示。
最后將預測值與真實值進行偏差計算,如表7所示。
2.1.3 大數據分析與常規數理統計預測精度對比
大數據分析與常規數理統計預測精度對比,如圖4所示。
通過繪制時間序列圖,將常規梳理統計預測值、大數據預測值分別與真實值進行偏差對比,可以看出,大數據預測精度遠大于常規梳理統計的預測精度。
2.2 數據挖掘能力對比
常規數理統計需要挖掘數據隱含的信息,需要借助相應的現場分析為手段,例如需分析出結果指標的異常是因為哪類過程指標異常導致的。其需要建立各級過程指標對結果指標的影響程度,其次在結果指標異常時通過現場人員從影響程度高的指標進行逐一排查。而大數據分析可直接通過結果指標的允許范圍得出各級過程指標的取值范圍,自動進行預測分析并得出對應的結論。
2.2.1 常規數理統計分析
以某卷煙廠加料出口水分為例進行說明。
第一步:計算各級參數的Pearson系數,形成對應的Pearson矩陣,如表8、表9所示。
第二步:將各級參數的R值進行排列。
由以上的Pearson矩陣可以得出,各級參數與結果指標P值均小于0.05,表明各級參數均與結果指標相關,并得出各級參數的相關性R值大小,如表10所示。
繪制出如圖5的餅圖。
2.2.2 大數據分析
第一步:通過決策樹形成重要度排列圖,如圖6所示。
第二步:通過神經網絡求出結果指標對應的過程指標的相應范圍。
基于結果指標的望目特性(中心值是18.20%)的允差上下限為[17.20%,19.20%],運用大數據預測技術得出各級過程參數對應的有效取值范圍。
運用R語言分析,一級加料入口含水率預測有效范圍如圖7所示。
通過大數據預測結果可以看出,為保證一級加料出口含水率滿足標準,一級加料入口含水率有效取值范圍應為[16.07%,16.75%]。
運用R語言分析,一級加料工藝熱風溫度預測范圍如圖8所示。
通過大數據預測結果可以看出,為保證一級加料出口含水率滿足標準,一級加料工藝熱風溫度有效取值范圍應為[52.06%,51.90%]。
運用R語言分析,一級加料蒸汽自動閥門開度預測有效范圍如圖9所示。
通過大數據預測結果可以看出,為保證一級加料出口含水率滿足標準,一級加料蒸汽自動閥門開度有效取值范圍應為[51.70%,53.63%]。
運用R語言分析,一級加料出料溫度預測有效范圍如圖10所示。
通過大數據預測結果可以看出,為保證一級加料出口含水率滿足標準,一級加料出料溫度有效取值范圍應為[51.27℃,53.59℃]。
運用R語言分析,一級加料工藝流量預測有效范圍如圖11所示。
通過大數據預測結果可以看出,為保證一級加料出口含水率滿足標準,一級加料工藝流量有效取值范圍應為[2 946kg/h,3 000kg/h]。
小結:通過對比大數據分析和常規梳理統計分析,可以看出,大數據能夠實現通過結果指標的取值范圍挖掘出過程指標的取值范圍。而常規梳理統計只能做到重要度的排序,因此,大數據分析對應的數據挖掘能力遠大于常規數理統計分析對應的數據挖掘能力。
2.3 自適應能力對比
常規數理統計不具備自適應的算法,所謂的自適應算法,是指處理和分析過程中,能夠根據被處理數據的數據特征自動調整處理方法、處理順序、處理參數、邊界條件或約束條件,使其與所處理數據的統計分布特征、結構特征相適應,以取得最佳的處理效果。
大數據分析由于加載了自適應分析模塊,通過加載機器自學習算法,能夠實現“松耦合、高擴展、低成本”的柔性化控制,即能夠通過機器自學習自動根據數據特性的變化得出對應的新的控制標準,避免了卷煙廠的重復、不必要的投資,實現系統由原先的“封閉式”轉變為“自我更新,自我優化”,提升系統的競爭力。圖12為自適應分析算法流程圖。
第一步:加d自適應算法
能夠加載自適應算法,按照自適應模型進行機器自學習,確保其能不斷滿足生產的實際情況。
第二步:根據數據質量特性運用機器自學習形成新的標準
以松散回潮出口水分為例,其2015年和2016年通過機器自學習得出控制標準,運用R語言分析,得出結果,如圖13所示。
圖13 松散回潮出口水分標準自適應結果
從機器自學算法可以看出,2015年松散回潮出料含水率標準為[15.41%,18.32%],而2016年松散回潮出料含水率標準自適應變更為[14.30%,17.29%]。
2.4 數據質量分析能力對比
常規數理統計無法通過對應的方法實現對數據真實性、完整性、及時性與是否進行加載的平滑算法進行驗證。需要從別的角度進行分析和驗證。例如需要從底層PLC程序、上位WINCC程序進行解讀才能知道是否加載了平滑算法。對數采點時間是否對應進行數據及時性的分析。大數據分析由于集成了擬合分布、AdaBoost、延遲有效性判斷等算法,可實現數據真實性、完整性、及時性與是否采用平滑算法進行全面的分析和判斷。
數據真實性判斷:數據真實性判斷通過擬合分布來實現。通過自適應建立各關鍵工序對應的擬合分布情況,進行擬合分布檢驗,當檢驗結果存在顯著差異時,其數據的真實性就有待質疑。
數據完整性判斷:數據完整性判斷通過AdaBoost管控來實現。以歷史數據為依據,建立以來料重量為依據的數采樣本量預測區間,當實際數采樣本數據量不在置信區間時,其數據的完整性就有待質疑。
數據及時性判斷:數據及時性判斷通過延遲判斷有效性來實現。以歷史數據為依據,建立各關鍵工序的數采延遲庫,進行單樣本T檢驗,當檢驗結果存在顯著差異時,其數據的及時性就有待質疑。
數據是否采用平滑算法判斷:建立數據質量驗證功能庫,加載多種算法,對數據是否采用平滑算法進行驗證,通過以下兩種方法根據實際情況進行篩選,得出數據質量驗證可信度。
第一種對每種算法加載不同的權重,采用加權的方式得出最終的可信度得分。
第二種對某種基本算法加入一票否決項,當某種算法無法通過時,則直接將數據可信度置為0。其他算法無法通過時,采用扣分的形式得出最終的可信度得分。
當可信度低時,則認為數據可能存在平滑處理的可能。
以數據真實判斷為示例進行說明,進而說明大數據的數據質量分析能力。
以某煙廠制絲烘絲工序為例進行演示。
通過大數據進行擬合優度檢驗。
伽馬分布判斷,如圖14所示。
由圖14可知,數據歸集不全聚類于伽馬分布的線性要求,因此數據特性分布不滿足伽馬分布。
對數正態分布判斷,如圖15所示。
由圖15可知,數據歸集聚類于對數正態分布的線性要求,因此數據特性分布滿足對數正態分布。
Weibull(威布爾)分布判斷,如圖16所示。
由圖16可知,數據歸集不全聚類于Weibull分布的線性要求,因此數據特性分布不滿足Weibull分布。
正態分布判斷,如圖17所示。
由圖17可知,數據歸集不全聚類于正態分布的線性要求,因此數據特性分布不滿足正態分布。
通過檢驗可以看出,其烘絲出口水分歷史數據滿足對數正態分布。
通過對實際某批次烘絲出口水分進行分析,情況如圖18所示。
由D18可知,數據歸集聚類于正態分布的線性要求,因此數據特性分布滿足正態分布。與歷史數據的分布不同(傳統數據服從對數正態分布),因此判斷其數據的真實性有待商榷。
3 大數據技術在煙草制造過程中工藝管控的運用前景
大數據技術在煙草制造過程中工藝管控的運用前景可概括為以下3點。
3.1 可實現工藝管控“三級聯動”的智能診斷分析
運用大數據技術,建立生產技術標準執行力的三級聯動診斷機制,形成標準執行力評價與結果指標評價相結合的紐帶,當結果指標異常時能智能診斷出是哪個過程指標異常導致的,這是一級診斷。除了分析過程指標以外,還能針對“5M1E”(人、機、料、法、環、測)保障因素進行聯動診斷分析,深入挖掘原因,這是第二級診斷。在找到原因后,還能通過專家庫自動發送對應的解決方案,這是第三級診斷。通過三級診斷分析全面建立一個包含“發現問題、分析問題、解決問題”的智能化PDCA循環,全面提升工藝管控智能化的管控水平。
3.2 可實現智能化料頭與料尾的自動截取
運用大數據技術,以歷史數據為依據,通過對歷史數據的分布運用聚類分析方法,將數據值區分為待機值、臨界值、穩態值三類,同時結合差分方法,更為準確地判斷料頭與料尾的位置,進一步實現非穩態數據的智能篩選。
例如,通過對一段時間內“葉絲干燥出料含水率”的生產數采數據進行聚類分析,分類結果如圖19所示,第一類為穩態數據,第二類為料頭料尾數據,第三類為待機數據。
根據以上分析,加載對應的自適應算法,即可實現對所有批次的智能化料頭與料尾的自動截取功能。
3.3 可實現生產技術標準適用性自適應分析
運用大數據技術,能夠根據大數據的方法對關鍵質量特性的相關性進行實時更新,并與生產技術的標準進行全面對比,提供生產技術標準適用性分析結果,如圖20所示。
能夠根據大數據隨機森林(樹)的方法對關鍵質量特性的重要度(當需要處理的數據龐大和實時性要求較高時,普通隨機樹建模過程耗時長,因此在部署“云”平臺的稚嫩診斷模型時,在隨機樹建模過程中加入了數據集特征提取)進行實時更新,通過與生產技術標準實時對比:①若關鍵質量特性與生產技術標準一致,則運行生產技術標準執行力自適應分析功能;②若關鍵質量特性與生產技術標準出現不一致的情況,則選擇一定周期內穩態數據運行關鍵質量特性自適應相關性擬合分析,形成生產技術標準執行力自適應分析結果,為生產技術標準的變更或換版提供數據支撐。
4 結 語
通過以上運用前景的初探,充分說明了大數據在煙草制造過程工藝管控發展前景較為廣闊,相信不久的將來,基于大數據分析的煙草制造過程中工藝管控的卷煙廠數量也將大幅提升,大數據技術將幫助卷煙廠的工藝控制水平實現螺旋式上升。
注:李達,通訊作者
主要參考文獻
[1]閆磊.煙草行業分銷管理系統[D].濟南:山東大學 2008.
[2]段永光.中國煙草工業兼并重組績效研究[D].長沙:中南大學,2008.
[3]羅民軍.株洲市煙草公司財務管理模式優化研究[D].長沙:中南大學,2008.
[4]李民燈.HH市煙草公司人力資源管理體系診斷與優化研究[D]. 長沙:中南大學,2008.
[5]劉兆茜.企業信息化評價指標體系研究與應用[D].上海:復旦大學,2008.
[6]梁忠偉.制度變遷視角下的我國煙草專賣制改革[D].廣州:暨南大學, 2008.
[7]陳軍.上海煙草集團公司生產計劃管理發展探討[D].上海:復旦大學, 2008.