前言:中文期刊網精心挑選了統計數據分析范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
統計數據分析范文1
1.1與實際工作的融合性
機械加工企業的日常生產涉及多個方面的專業知識,總體可以概括為機械結構件的熱加工和冷加工形式,包括熱處理、電鍍、裝配、車、銑、刨、鉆、磨、鉗等工序和工種。所以,機械加工企業的統計管理者,需要對這些工序和工種有一定的了解,合理的分辨出各種生產信息和管理信息,并進行科學的統計,才能在本質上體現統計工作的意義和作用。
1.2監督管理的職能
機械加工企業的統計工作,主要表現在對企業各個部門、環節的經濟和生產活動的運轉狀況,開展宏觀和微觀的檢測,并根據檢查結果對活動中出現的失控、異常情況進行分析探討,考核企業的經濟技術指標情況,明確部門的相關責任,為企業提供科學、全面、客觀的信息資料,保證企業的經營決策更加科學性和先進性。
2、統計數據質量監控評價體系的建立
2.1建立評價指標體系
創建一套科學、合理且具有一定可行性的統計數據質量監控評價體系,是國內統計行業長期探討并研究的課題。而對于企業評價指標體系的建立,必須要以能夠徹底反映機械加工企業的實際生產經營活動為基礎,確保統計數據的質量監控能夠完全落實。鑒于這個出發點,企業評價體系的建立要滿足以下四點要求:1)可行性。評價指標體系中指標的涵義要明確,涉及的資料要容易獲得,計算方式簡便,在保證各種指標能夠相互銜接的同時,還要確保指標的穩定性。2)整體性。評價指標體系中涉及的內容要全面、評價要準確,并能系統地反映出企業各部門的生產經營情況。3)可比性。建立的評價體系需要通過對歷史、行業等統計數據質量的應用情況中獲取經驗。通過對不同歷史階段的統計數據質量對比,可以了解到統計數據質量的發展與變化,并設置評價體系需要提高的幅度;通過對不同行業、不同單位、不同部門統計數據的質量進行對比,可使本企業的統計數據質量得以提高。4)可量性。統計數據質量的影響因素眾多,這些影響因素有的可數量化,有的則無法進行數量化。所以,評價體系的建立應以可數量化的影響因素為基礎,從大體上確保統計數據的質量。
2.2制定評價指標
統計數據使用者的不同,對質量的側重點與評價標準的要求也不同。對于企業的管理者而言,統計數據的內容應包括生產經營的計劃編制、成本核算等全面反映企業經營狀況的統計數據,涉及的評價指標要具有適用性、全面性、及時性和準確性。1)適用性。評價指標的適用性是指統計數據在滿足國家統計管理規范要求的前提下,能夠完全適用于企業的微觀管理需求。2)全面性。統計數據要系統的、全面的反映出企業經營生產的全孫惠鞍鋼重型機械有限責任公司冶煉設備制造廠遼寧鞍山114021貌與全過程。3)及時性。數據的統計工作,要嚴格的按照統計報表中所規定的調查和搜集時間執行,并及時完成各種資料和報表的上報任務,以備企業管理者及時作出生產決策。4)準確性。統計指標要結合本企業的生產加工特點并按照統計工作流程,再經過科學的設計、調查和搜集,確保統計指標能夠真實并準確的反映企業的經營狀況。
3、原始資料偏差的測定方法
統計數據質量出現偏差大致可分兩種情況,其一是人為的瞞報或虛報。這種情況屬于系統性的偏差范疇,其內部具有一定的規律可尋;其二是隨機性偏差。當企業的統計人員預測定原始資料是否存在偏差時,首先應判斷這些大量的原始資料是否屬于系統性的偏差,找出失真的原始資料并將其剔除或修正,確保評估結果的準確性,保證統計數據的監控質量。在技術應用上,可以采用方差分析的方法和思想,對原始資料中的失真情況進行判別,再經過多重比較或采用效應圖的分析方法對這些資料進行篩選。在修正并清除部分失真的資料后,對原始資料再進行最終評估。利用方差分析結合多重比較或效應圖的方法,可以有效的鑒定原始資料的偏差,確保統計數據的可靠性和真實性。
4、統計數據質量的保障措施
企業的統計工作屬于基層統計,是國家經濟統計數據的源頭,是企業未來發展規劃與決策的基石。因此,提高企業統計工作的評估質量,就必須要從統計的源頭數據做起,通過嚴格落實一些列的監控保障措施,提高原始資料的可靠性和準確性。1)機械加工企業的統計數據質量監控體系的建立,應以國家統計的法津和法規為基本出發點,將企業的統計工作并入法制的軌道,依法統計、法制監控。2)機械加工企業要始終以“實事求是、質量第一、相互監督”為基本原則,對企業統計人員和領導的統計工作態度和道德進行監控。3)加強企業統計工作的基礎建設,確保企業統計工作的標準化,監控制度的規范化。4)企業應加快統計工作的網絡化建設并運用現代化的統計方法,實現統計工作的網絡化辦公。同時應增設統計信息的管理中心,對企業的統計工作和數據進行實時監控。5)加強對企業統計人員的業務能力培訓,提高統計團隊的綜合業務素質,減少較高業務能力的人才流失,并對統計人員的日常統計工作進行有效監控。6)運用科學且合理的統計和分析方法,反復驗證和評估統計數據質量的真實性和可靠性,對數據產生偏差的原因進行分析,對統計的過程進行監控。7)建立并健全統計工作的質量考核與獎罰制度,嚴格落實統計數據質量監控體系的相關規定。
5、結束語
統計數據分析范文2
文獻標識碼:A 文章編號:1672-7800(2015)005-0098-02
作者簡介:陳冠星(1984-),男,廣東揭陽人,碩士,海南軟件職業技術學院網絡工程系助教,研究方向為數據庫、網絡技術與物聯網。
1 數據倉庫簡介
數據倉庫(Data Warehouse,DW)是隨著關系數據庫、并行處理和分布式技術的飛速發展而產生的[1], W?H?Inmon出版了《Building the Data Warehouse》一書,給出了數據倉庫的定義:數據倉庫是一個面向主題的、集成的、非易失的、隨時間變化的用來支持管理人員決策的數據集合[2]。數據倉庫包含的是整個企業視圖的粒度化數據。
數據倉庫系統通常對多個異構數據源有效集成,集成后按照主題進行重組[3]。存放在數據倉庫中的數據通常不再修改,用作進一步的分析型數據處理。
數據倉庫系統的建立和開發以企事業單位的現有業務系統和大量業務數據的積累為基礎 [4],其開發是一個循環迭代過程,通常需要企業有一定的業務數據積累,開發人員將這些歷史數據通過ETL輸入到數據倉庫中,進行分析和統計,以建立決策支持輔助系統,為企事業單位管理者提供決策支持。
2 保險業需求分析
隨著保險業發展及保險市場競爭的加劇,保險公司在管理和運營方面面臨著更高的要求,來自監管、競爭、技術更新及全球化等各方面的壓力不斷考驗著保險企業。保險業發展的核心動力表現在以下幾個方面:①進入新分市場及提高業務質量;②鞏固客戶忠誠度,適應客戶多變的需求;③高效的運營;④精確的風險及成本控制;⑤消除各種技術壁壘。
要做到上述目標并不容易。對高層管理者來說,由于統計口徑的關系,很難獲取一致性數據進行比對,很難及時監控到業務狀況,不能有效地進行決策支持。對于業務部門主管與業務分析員,所需報表難以及時獲取,即使取得的數據也難用于多視角、全方位地分析業務問題。對于IT部門來說,要不斷幫助業務部門制作報表,時間相對較長,而且開發的報表越多,特別是分析型的報表越多,業務系統性能越受影響。
以某人壽保險有限公司為例,該公司的數據支持情況如下:
(1)保單管理系統中大致有50張左右的報表在運行,但隨著公司業務的發展,數據分析及用于日常管理的制式報表與日俱增,報表數量將很快無法滿足業務發展需求。
(2)各業務管理部門有各自的制式報表及統計需求,但在將數據匯總時,時常出現因統計時點不同、指標定義的理解差異等原因造成數據不一致,導致額外的數據校驗工作。
(3)當前報表的IT實現基本上是按照單個報表需求來設計的,造成IT設計無法復用,報表開發缺乏整體規劃,呈一種臨時性狀態,隨著報表及統計需求的增加,IT相應的工作將與日俱增。
(4)因當前報表及數據統計都在保單管理系統中運行,隨著需求數量的增加,保單管理系統將面臨沉重的夜間批處理壓力并嚴重影響日間日常業務操作的效率及穩定性。
針對上述系統現狀,在建設中決定采用數據建模、ETL、數據分析以及數據展現等技術,實現風險管控分析、客戶服務分析、客戶維持分析、市場銷售分析、綜合分析和綜合管理6大功能,達到以下目標:①代替原有手工報表方式,為業務人員節省時間;②提供精細的分析數據。業績分析可以從營業部,鉆取到營業組,甚至每個FC(理財顧問),保全分析可以分析每種保全項目的明細;③統一的分析口徑。各部門統計指標,可以在統一的時間點上進行公司級匯總;名稱一致的統計口徑,可以唯一定義一種統計方式;④唯一的報表平臺。從報表需求獲取到報表需求分析以及最后的實現都在一個體系下完成,公司數據分析工作逐步系統化和實用化。
3 系統設計
統計分析系統采用靈活架構,在構建一個統一、穩定的企業級數據倉庫基礎上,分步構建各個獨立的分析應用數據集市,滿足靈活性、擴展性要求,系統架構如圖1所示。
保險數據倉庫是一個中央的知識數據庫,包含來自壽險系統、團險系統、短期險系統和電話銷售系統等源系統的源數據,數據模型分為3層:
(1)數據準備層(Staging Layer): 采用同源系統相似的數據結構存儲源系統的每日增量數據。
(2)保險企業模型層(Insurance Enterprise Models Layer): 作為保險數據倉庫的核心,相應的保險企業模型部署在該層。根據保險行業的業務視圖,保險企業模型分為10個主題,根據保險信息的特性而非事務處理的目的來設計,企業級上所有保險業務信息根據歷史版本進行記錄。在數據準備層通過ETL(數據抽取轉換裝載程序)進行數據批處理,采用增量機制裝載進入保險企業模型。
(3)分析數據模型層(Analysis Data Models Layer): 各種各樣的數據分析需求歸類到不同的數據集市,如市場及銷售數據集市、運營效能數據集市、風險管控數據集市等。分析數據模型即為滿足數據集市需求而采用維度建模方法特別設計的模型。分析數據模型從保險企業模型衍生而來,數據通過ETL 批處理,采用增量機制裝載進入保險企業模型。
ETL采用增量機制,每日從源系統抽取變更數據至Staging層,接著將Staging層數據轉換至企業模型和分析模型。在ETL批處理完成后,系統運行報表批處理生成報表并到相應的報表文件服務器上。
OLAP元數據管理工具: 提供OLAP 元數據管理工具,用于管理所有OLAP 業務元數據,包括指標定義、維度層次定義、指標與維度的關系及分析需求。通過使用這個工具可幫助保險企業統一KPI 定義及促進企業標準化管理,同時其管理的內容可作為統計分析系統所支持的知識庫來使用。
OLAP平臺:選擇微軟的SQL Server 2008作為OLAP平臺。OLAP 工具支持分析的類型包括管理儀表盤、平衡記分卡、制式化管理報表、臨時查詢、數據挖掘等。
4 系統實現
4.1 ETL實現
ETL采用SQL Server集成服務來實現。Microsoft Integration Services 是一個可以生成高性能數據集成解決方案(包括為數據倉庫提取、轉換和加載ETL包)的平臺。Integration Services包括生成和調式包的圖形工具和向導;執行工作流函數操作和執行SQL腳本等任務;提取和加載數據的數據源和目標;清除、聚合、合并和復制數據的轉換;管理包執行和存儲的管理服務,即Integration Services;用于Integration Services對象模型編程的應用程序編程接口(API)。
4.2 多維數據實現
創建報表之前,需要通過SQL Server分析創建多維數據模型。之所以使用SQL Server分析服務創建多維模型,主要是為了實現對業務數據的即席查詢。系統開發人員創建多維數據集以支持快速響應,并提供單個數據源以進行業務報告。商業智能的重要性不斷提高,使用單一的分析數據源可確保將差異減到最小(如果無法完全消除差異)。
4.3 報表系統實現
報表系統實現使用了SQL Server報表服務,報表服務包含一整套管理報表的工具。報表工具在微軟的開發環境中工作,并與SQL Server無縫銜接。通過報表服務,可以從多種不同的數據源創建各種不同樣式的報表。
5 應用效果
該系統目前已經在某人壽保險有限公司正式投入使用,結果顯示,該系統使業務數據的分析效率、分析能力大大提高,在一定程度上簡化了業務人員數據統計工作,對公司決策支持起到很大的幫助作用,系統良好的應用價值體現在以下幾個方面:①數據集成。數據倉庫能夠把來自多個不同子系統的數據進行有效集成,提供統一的、一站式的業務報表系統;②查詢靈活方便。統計分析系統能夠根據不同的需求進行條件過濾,并支持數據向上向下鉆取,數據查詢方式更加靈活,追溯更加簡單直接,為業務分析人員提供了很大的便利;③安全性高。為了保證數據的安全性和可靠性,對數據倉庫中的數據實行統一管理;④降低成本。統計分析系統的建立,可以代替原來的手工匯總操作,一次創建,只需要進行簡單的維護就可長期使用。
6 結語
本系統開發及系統運行工作得到如下經驗及啟示:
(1)理念的轉變。在數據分析上,需要從清單和簡單匯總上升到數據分析,從單個部門分析到全局分析,從數據庫到數據倉庫進行分析設計。
統計數據分析范文3
[摘 要]以區域卷煙重點消費者調查為主要內容,闡述了消費者調查的戰略意義與基本思路。進一步以XX市卷煙消費者調查為例,將重點消費者按卷煙價位劃分消費群體,運用SPSS軟件比較研究了年齡組成、職業組成、月收入、卷煙月支出等四項基礎指標數據,對后續建立卷煙消費者數據庫具有重要支撐作用。
[關鍵詞]消費者細分 重點消費者 卷煙價位 統計指標
一、消費者調查
消費者細分是把握卷煙消費市場的重點,也是把握卷煙消費市場細分的關鍵環節。因此,實現營銷服務向消費者延伸,與消費者進行更為直接的接觸,構建起面向消費者的現代卷煙營銷體系,成為煙草行業全面迎接市場競爭的重要工作。而打造一條與消費者的高效溝通渠道,建立與消費者的長效溝通機制,則是建立面向消費者營銷體系的一項基礎工作。在此項工作中,對卷煙消費者的選取應遵循自愿原則,對消費者的選擇應包括不同價格消費人群、不同的消費習慣、省內省外卷煙購買習慣等。此外,所選取的消費者要進行篩選,確保進入消費者數據的消費者能保持長期的穩定性,并可以不斷進行補充。與消費者的溝通內容及途徑、配合要求及支持分別闡述如下。
1.溝通內容及途徑
與消費者的溝通主要包括下列信息:煙草行業發展史、近期煙草行業發展策略、品牌發展、新品上市、服務意向、價格變動、市場管理、消費變化等,使消費者了解和掌握相關信息內容。此外,與消費者溝通的途徑大致包括:(1)建立消費者溝通網站,讓消費者自由登錄瀏覽,獲取其感興趣的卷煙信息及政策法規;(2)自辦雜志刊物發放,將企業掌握的近期最新消息向消費者傳遞;(3)定時向消費者發送手機短信和郵件,讓消費者隨時隨地感受到關心與被關注;(4)品牌經理要對消費者進行定期的面對面拜訪交流,根據消費者的服務需求提供個性化的服務營銷;(5)定期召開消費者座談會,雙方客觀、全面、開放地查找和解決問題,讓消費者感受自身群體的存在和企業對消費者的關心。
2.配合要求及支持
以卷煙重點消費者為例,其配合要求大致包括:(1)定期填寫市場調研表。能夠按要求認真填寫品牌經理發放的各項調研表格,并及時進行反饋,反饋內容要真實可靠,保障溝通的效率。(2)及時反饋卷煙消費信息。對于重點消費者在其消費群中發生的消費變化情況,可通過相關渠道及時進行反饋,反饋的信息要真實可靠。(3)進行卷煙的上市宣傳。對于新上市的品牌,重點消費者在其消費群體中可進行宣傳,了解其周圍消費群體的消費態度并將收集情況向品牌經理進行反饋。(4)對煙草公司服務進行評價。對煙草公司的服務在其消費群體中的反映,重點消費者要進行收集并反饋。此外,與重點消費者的溝通支持方式有:新品卷煙發放試吸、邀請參加公司促銷會議、人情關懷、重點消費者評優等。
二、消費者調查實例
對XX市重點消費者的調查,采用分群隨機抽樣法在該市所有轄區展開問卷調查活動,收集重點消費者信息,通過關鍵購買因素和對品牌的需求因素開展消費者識別,從性別、年齡、職業、收入、愛好、價值觀、健康意識等方面進行消費者細分,在XX市所有轄區建立不少于2000戶的重點消費者信息庫。為此,設計并印制了包括15個問題在內的重點消費者調查問卷。進行問卷調查的時間共計15日,問卷回收率為84%,問卷有效率為96%。問卷涉及XX市7區2縣1市,問卷涉及大中型企業、商業公司、政府機關、事業單位在內的13類行業。將重點消費者按卷煙價位劃分為“10元~15元”和“15元~20元”消費群體,分別統計并分析年齡組成、職業組成、月收入、卷煙月支出等四項指標數據。
1.卷煙價位處于“10元~15元”消費群體分指標統計數據
(1)消費者年齡組成
表1表明,購買卷煙價位處于10元~15元的消費群體,年齡處于18歲~35歲階段的人數最多,占59.97%;其次是35歲~55歲階段,占36.8%;55歲以上的消費者僅占2.39%;18歲以下的消費者最少,占0.84%。運用SPSS軟件對購買卷煙價位處于10元~15元的消費群體年齡組成頻數分布情況進行數據分析,見表2。表2顯示:此分布結構中偏度為0.533,表明偏度值大于零,此變量分布為正偏,偏度較輕微;同時,峰度為-2.98,表明峰度值小于零,此變量分布的峰度為輕微的平頂分布。
(2)消費者職業組成。表3表明,購買卷煙價位處于10元~15元的消費者群體,大部分消費者的職業是工人,占30.76%;其次是學生和自由職業,分別占12.92%和15.54%;再次是政府職員和商人,分別占9.41%和5.76%;較少的是農民和軍人,僅占1.4%和0.14%。運用SPSS軟件對購買卷煙價位處于10元~15元的消費群體職業組成頻數分布情況進行數據分析,見表4。表4顯示:此分布結構中偏度為0.63,表明偏度值大于零,此變量分布為正偏,偏度較輕微;同時,峰度為-0.528,表明峰度值小于零,此變量分布的峰度為輕微的平頂分布。
(3)月收入組成。表5表明,購買卷煙價位處于10元~15元的消費者群體,月收入大多為2000元~3000元,占40.03%;其次為1000元~2000元,占32.72%;再次為3000元以上,占16.15%,最少的為1000元及以下,占11.1%。運用SPSS軟件對購買卷煙價位處于10元~15元的消費群體月收入組成頻數分布情況進行數據分析,見表6。表6顯示:此分布結構中偏度為0.125,表明偏度值大于零,此變量分布為正偏,偏度較輕微;同時,峰度為-4.021,表明峰度值小于零,此變量分布的峰度為較嚴重的平頂分布。
(4)月支出組成。表7表明,購買卷煙價位處于10元~15元的消費者群體中,每月用于購煙的支出大多為200元~300元,占45.22%;其次為300元以上,占23.74%;再次為100-200元,占21.91%;最少的為100元及以下,占9.13%。運用SPSS軟件對購買卷煙價位處于10元~15元的消費群體月支出組成頻數分布情況進行數據分析,見表8。表8顯示:此分布結構中偏度為0.844,表明偏度值大于零,此變量分布為正偏,偏度較輕微;同時,峰度為1.833,表明峰度值大于零,此變量分布的峰度為輕微的尖頂分布。
2.卷煙價位處于“15元~20元”消費群體分指標統計數據
(1)消費者年齡組成。表9表明,購買卷煙價位處于15元~20元的消費群體,年齡處于18歲~35歲階段和35歲~55歲階段的人數最多,分別占47.9 %和46.31%;55歲以上的消費者僅占4.59%;18歲以下的消費者最少,僅占1.2%。運用SPSS軟件對購買卷煙價位處于15元~20元的消費群體年齡組成頻數分布情況進行數據分析,見表10。表10顯示:此分布結構中偏度為-0.012,偏度值小于零且接近零,故此變量分布為負偏,偏度較輕微;同時,峰度為-5.893,表明峰度值小于零,此變量分布的峰度為輕微的平頂分布。
(2)消費者職業組成。表11表明,購買卷煙價位處于15元~20元的消費者群體,大部分消費者的職業為工人,占24.95%;其次為自由職業,占14.57%;再次為商人和政府職員,分別占9.98%占9.38%;學生和農民較少,分別占4.19%和3.19%;軍人幾乎沒有,僅占0.2%。運用SPSS軟件對購買卷煙價位處于15元~20元的消費群體職業組成頻數分布情況進行數據分析,見表12。表12顯示:此分布結構中,偏度為0.998,表明偏度值大于零,此變量分布為正偏,偏度較輕微;同時,峰度為0.111,表明峰度值大于零,此變量分布的峰度為輕微的尖頂分布。
(3)月收入組成。表13表明,購買卷煙價位處于15元~20元的消費者群體,月收入大多為2000元~3000元,占49.1%;其次為3000元以上,占31.54%;再次為1000元~2000元,占15.77%,最少的為1000元及以下,僅占3.59%。運用SPSS軟件對購買卷煙價位處于15元~20元的消費群體月收入組成頻數分布情況進行數據分析,見表14。表14顯示:此分布結構中偏度為0.32,表明偏度值大于零,此變量分布為正偏,偏度較輕微;同時,峰度為-1.243,表明峰度值小于零,此變量分布的峰度為輕微的平頂分布。
(4)月支出組成。表15表明,購買卷煙價位處于15元~20元的消費者群體,每月用于購煙的支出大多為200元~300元和300元以上,分別占39.72%和37.13%;其次為100元~200元,占17.96%;最少的為100元及以下,僅占5.19%。運用SPSS軟件對購買卷煙價位處于15元~20元的消費群體月支出組成頻數分布情況進行數據分析,見表16。表16顯示:此分布結構中偏度為-0.477,表明偏度值小于零,此變量分布為負偏,偏度較輕微;同時,峰度為-3.099,表明峰度值小于零,此變量分布的峰度為平頂分布。
綜上,以XX市卷煙重點消費者調查為例,將消費者按卷煙價位劃分為“10元~15元”和“15元~20元”消費群體,比較研究了年齡組成、職業組成、月收入、卷煙月支出等四項基礎指標數據。上述研究結果,屬于XX市卷煙重點消費者調查研究范疇,對后續區域卷煙品牌發展戰略、卷煙消費市場細分、卷煙消費者數據庫建立等均具有重要支撐作用,特別是對未來建立卷煙消費者數據庫提供了寶貴的基礎數據和對比研究成果。
參考文獻:
[1]劉思峰,黨耀國. 預測方法與技術[M].北京:高等教育出版社,2005.
[2]林杰斌,林川雄等.SPSS12統計建模與應用實務[M].北京:中國鐵道出版社,2006
[3]統計預測與決策(第三版)[M].上海:上海財經大學出版社,2008.
[4]杜棟,龐慶華,吳炎.現代綜合評價方法與案例精選(第2版)[M].北京:清華大學出版社,2008.
統計數據分析范文4
隨著市場競爭的日益激烈,倡導所有的企業“以用戶為中心、以市場為導向、以效益為目標”,企業的發展都面臨著前所未有的挑戰,要想在競爭中立于不敗之地,就有必要不斷增強企業的精確化管理和精確化營銷。報表廣泛應用于各行各業,不僅是整理和分析數據的有效的手段之一,也是企業單位決策的重要依據,在企業單位中有著重要的地位,也是信息化的最重要的組成部分。但是由于報表的種類繁多、形式復雜多變,給計算機的實現帶來一定的麻煩。為了適應不斷變化的格式,需要重新改寫程序,通常需要為每一格式的報表定制編程,使得成本很高并且不具有靈活性。所以企業單位中數據統計分析報表系統的設計一直是研究開發人員的重點研究的問題。
報表情況概述
(一)報表的定義理解。報表,就是將內容信息(一般是數據、文字、圖片等)以某種形式組織起來,并將組織結果呈現出來的文件。只要是做數據的呈現,無論數據存在于文本文件內、Excel文件或者是在數據庫之內,只要可以將它呈現出來,打印輸出格式化的數據信息,就是一份報表。報表作為一種信息組織和分析的有利手段,在各行各業都應用廣泛,是信息瀏覽、分析、打印的有利工具,也是企業信息系統重要組成部分之一。
(二)報表的分類。按格式可以分為靜態格式和動態格式。靜態格式報表是由政府等管理組織制定的,格式固定而且復雜,格式與數據來源在開發時就已經固定,在使用時不需要改動,通過開發環境的自帶報表組件、應用程序、第三方控件實現,比如財務報表等。動態格式報表數據量較大,數據和格式需要經常變動,用戶需要自由定義,所以要有變通性和通用性,比如統計報表等。
(三)報表的構成。無論是靜態的還是動態的報表都是由表頭區、標題區、表體區及表尾區四個區域組成的。
(四)報表的內容。報表的內容包括兩個方面,一個是靜態不變的框架結構,即表頭區、標題區、及表尾區,這些結構在一段時間內是不會改變的。另外一個是動態的數據,指將數據庫內容,經過計算、查詢及綜合動態的操作,寫入到表格中的相應位置。
數據統計分析報表的重要性
向企業的領導和決策部門提供高質量的、準確的、及時的數據統計分析報表是企業數據管理部門的職能。提供高水平的數據統計分析報表是數據經過深加工的最終產品,是統計數據、分析研究的有機結合,為企業領導和決策部門提供優質的服務,是他們分析經濟運行態勢,制定宏觀決策和長遠規劃必不可少的重要依據。在計算機輔助技術迅速發展,世界市場動態多變,競爭日益激烈的世界經濟環境下,企業的生存環境發生著巨大的變化,各種新概念新模式不斷涌現,企業開始朝著全球化、敏捷化、智能化、信息化和個性化的方向發展。
傳統數據統計分析報表中存在的問題
常規的數據統計分析報表主要通過紙質報表、Excel報表及專門定制的軟件來呈現。而紙質的報表是最為常見的,大多企業的生產自動化的程度不高,計算機的應用不夠廣泛,工作人員接受創新事物的能力差等原因,所以大多的企業采用的是紙質的報表,數據的統計部門,根據需求手繪制定報表的格式,下發到其他的部門或者是生產的車間內,由部門的負責人或者是車間的管理人員按照要求填寫所要的數據或者其他的指標性文字,再返回到數據統計部門。
Excel報表是在紙質報表上的一大進步,簡化了紙質報表的很多程序。統計部門可以根據數據的要求在計算機上繪制電子表格,定義要求。通過網絡下發到各部門和車間。數據的計算工作可以通過在計算機上引入公式完成。但是這種報表的統計分析工作還得通過統計人員手動匯總計算,統計分析形成最終的報表。
還有就是專門定制的軟件,這樣的軟件并不是通用于所有的部門的,他們有著許多使用的局限性,例如制造企業的管理和設計軟件能實現各生產部門的數據統計分析、形成制造業通用的報表,而不能靈活的完成其他形式的報表。
數據統計分析報表系統的設計
數據統計分析報表的設計最關鍵的環節就是報表的模板和報表的輸出,下面就Excel報表模板及利用DDE通信、ACCESS數據庫、OLE幾種報表的輸出方式探討了數據統計分析報表系統的設計。
(一)利用Excel制定報表模板。通過運用Excel的制表功能,制定出不同的報表模板,不管是檢定結果還是鑒定證書等樣式的報表,每個報表的模板可以按照不同的數據需求,制定不同的結構,有報表格式、表頭、表尾、框架等固定的部分。在制表的過程中由于計算機的智能會自動完成一些簡單的合并、對齊、字號、字體等工作。但是對于某些非常復雜的表格編程,上述的自動化程序不起太大的作用,這時我們可以在制表之前就對表格的格式及公式定義做一些設定。這樣,不僅減輕了編程與維護的工作量,還提高工作的效率。
(二)利用DDE通信來實現報表輸出。Excel是辦公必備的軟件,也是人們最常用的表格、計算及統計的軟件,它不僅查詢、瀏覽的功能強大,而且其中內置的運算函數十分豐富,使用非常便捷。Excel在報表中應用,應用人員得心應手。動態數據交換是Windows平臺中能夠彼此進行交換數據與發送指令,是完整的通信協議之一。DDE方式的應用,使計算機中的各種程序通過動態數據交換的方式和MCGS來進行數據交換,是實現利用計算機中的資源對MCGS的功能進行擴充的方式,通過動態數據交換使程序讀取MCGS數據庫的數據,再依據要求把所讀取的數據在Excel中顯示出來,完成報表的輸出。
(三)利用ACCESS數據庫來實現報表輸出。報表的制作通常是通過報表設計器或利用第三方的Activex的報表控件來實現。但是這兩種方法都存在著這樣那樣不足:報表設計器只適用于制作一些不帶有表格的報表,同時它必須與vB所提供的設計器進行結合使用,異常的麻煩;而利用第三方的Activex的報表控件來實現的,雖然相對簡便,可以通過套用應用于多種的報表格式中,但是實用性較差,在實際應用中某些功能難以滿足實際項目的要求。然而利用ACCESS數據庫能解決上述的問題,利用MCGS數據庫的訪問功能,把采集到的現場數據輸Access的數據庫中,然后通過MCGS內部函數來調用已有程序,把Access數據庫中的數據輸入到的Excel的報表中,從而實現報表輸出。
(四)利用OLE實現報表輸出。它是一種對象連接和嵌入技術,是一種集成應用程序,是一種能夠讓用戶共享各種不同程序的信息資源的技術。OLE技術可以將聲音、圖像、文字、影像結合于一體的。MCGS組態軟件其本身的OLE功能可幫助用戶在數據統計程序中十分方便地操作并讀取組態軟件所采集到的實時數據,從而制成報表。
統計數據分析范文5
關鍵詞:海量數據 NoSQL數據庫 高并發處理
中圖分類號:TP311 文獻標識碼:A 文章編號:1007-9416(2015)07-0000-00
1 引言
針對海量移動應用數據構建一套可行的統計分析系統,從基本的數據統計,到深入的數據分析、挖掘,可以為移動互聯網企業提供全方位的海量數據解決方案,幫助開發者更好的了解市場動向,了解用戶的使用習慣和需求,從而創造出更有價值的移動應用。
2 系統分析設計
本系統的用戶為移動應用開發者,系統的最終目的是為開發者們提供一個應用數據的統計分析平臺,為開發者提供實時的用戶統計數據和應用統計數據,開發者可以利用這些有價值的數據對應用進行調整,從而更好地適應不斷變化的市場需求。系統主要完成應用趨勢分析,版本分析,渠道分析,用戶參與度分析和終端屬性統計五部分。應用趨勢分析提供對新增用戶、活躍用戶、留存用戶和應用啟動次數的統計分析功能,開發者從這些數據中了解當前應用的用戶情況,判斷出未來趨勢。版本分析提供對當前應用所有版本的統計分析,開發者可以從中了解目前市場上的版本分布情況,從而可以對版本的更新迭代做出調整。渠道分析提供對當前應用各市場下載量的統計分析數據,開發者可以從中分析出各市場的推廣情況如何,從而有針對性的調整應用的推廣策略。
系統分為數據服務器、移動終端和WEB展示端三部分來完成,其整體的功能結構圖如圖1所示。在實現的過程中充分考慮解決海量數據處理的問題。通過使用非關系數據庫NoSQL,Epoll技術及數據庫優化技術解決高并發請求,有效地緩解了海量數據對整個系統的壓力。系統整體在Linux系統下完成開發,綜合運用當前主流高效的開發工具和技術。
數據服務器部分是整個系統的核心部分。數據接收模塊負責從移動終端獲取用戶數據和應用數據,數據緩存模塊用于緩存接收到的數據,數據存儲模塊負責向數據庫從存儲基礎數據,數據統計分析模塊負責對基礎用戶數據進行統計分析操作,處理后的數據用于網站端顯示。移動終端部分用于獲取數據?;赬ML語言對Android界面進行設計,通過對系統函數和XML解析獲取用戶數據和應用數據,后將數據通過TCP/IP協議發送給服務器端,若網絡不允許則將數據臨時緩存,等待下一次發送請求。網站展示端向開發者展示最終的統計分析數據。頁面設計模塊使用CSS對整體風格進行控制,繪圖模塊使用highcharts,使用php和javascript向highcharts填充數據。
3 系統總體設計與實現
本系統分為數據處理服務器,移動終端,WEB展示端三部分來完成。其中移動終端負責采集用戶數據和應用數據,將采集到的數據通過網絡傳輸給數據處理服務器。數據處理服務器一遍負責存儲數據,一遍對數據進行統計和分析。統計和分析的結果通過相應WEB端網站的請求反饋給開發者。整體的開發都在Linux系統下完成,移動終端部分使用Android平臺,使用Java語言進行開發。數據服務器使用Python進行開發,數據接收部分使用Linux下GCC庫,使用C++編寫,數據庫使用MongoDB。WEB展示端使用PHP語言進行開發,整體風格使用Bootstrap框架。同時使用Git作為版本控制工具,用GitHub作為版本容器,方便團隊協作和代碼更迭。
3.1 數據處理服務器架構
數據處理服務器需要實現數據接收、數據緩存、數據存儲和數據處理四部分功能。
數據處理服務器負責接收移動終端發送過來的用戶數據,通過高并發處理手段緩存到本地。數據庫處理程序負責從緩存文件中讀取數據插入到數據庫中。數據庫處理程序同時需要對基礎數據進行統計和分析處理,存儲到相應集合空間去。數據接收部分需要解決高并發請求。移動終端與服務器之間的通信使用TCP/IP協議,使用非阻塞的Socket連接來輪詢用戶請求。整體的底層架構使用Epoll庫,能夠很好的支持萬級別的并發量。數據緩存部分使用文件直接緩存。為了避免文件同時讀寫的鎖定問題,文件緩存按照一定的時間間隔寫入不同的文件中去。使用腳本文件拷貝寫入完成的數據文件到另外的文件夾用于向數據庫中寫入,寫入完成之后再將文件刪除。腳本使用python語言編寫。數據寫入部分也使用python進行編寫,數據采用非關系數據庫MongoDB。非關系數據庫在解決海量數據處理的問題上有著獨有的優勢,降低了程序與代碼的耦合度,同時還保證了數據存儲的可靠性。使用python處理數據寫入時需要用到MongoDB的python語言驅動,一般用pymongo即可。數據處理部分也使用python編寫。程序從MongoDB中讀取完數據之后,按照業務邏輯的要求對數據經行統計和分析。比如統計出某一應用一天的啟動次數。將這些統計數據存入到新的集合中去,留作網站展示端進行檢索。這樣可以大大減少網站端實時搜索對數據服務器造成的壓力。
3.2 移動終端架構
移動終端分為數據獲取、數據緩存、數據傳輸和界面設計四部分。移動終端整體架構使用MVC設計模式。前端界面設計使用XML進行配置,控制層將獲取到的數據一部分送至前端顯示,一部分送至數據服務器進行存儲。數據緩存使用SQLite保存未能發送至服務器的用戶數據。數據獲取指獲取用戶設備參數和用戶應用數據,設備參數包括設備的型號、分辨率、入網方式、內容服務商、系統版本號等,用戶應用數據包括應用的包名、版本號、啟動時間、使用時長、渠道信息、頁面訪問路徑等。數據緩存部分主要為了保證數據的完整性,因為用戶的設備并不能時刻保持網絡接入。當用戶處于離線狀態時,使用SQLite保存用戶信息。當用戶再次啟動時檢測是否有網絡接入,當發現網絡接入時將上一次的數據發送出去,同時清空SQLite數據庫。數據傳輸使用TCP/IP協議向數據庫服務器發送數據包。因為數據庫采用NoSQL數據庫,NoSQL數據庫的存儲格式為BSON(BSON是對JSON格式的二進制化),因此在數據發送之前需要將數據序列化為JSON格式。數據發送時需檢測數據是否正常發送,如果沒有正常發送則進行重發操作。界面設計采用Android標準開發模式,使用XML文件配置界面。頂部使用Google官方庫ActionBar,中間部分為ListView組件,ListView的每個Item都為一個數據,表示移動終端獲取到的某個變量。
3.3 網站展示端
網站展示端包括前端設計、數據處理和數據報表三部分。
前端設計以美觀大方為目標,使用twitter前端開源框架Bootstrap。Bootstrap提供了優雅的HTML和CSS書寫規范,它由Less寫成,Less是一種優美的動態CSS語言。使用Ajax、jQuery、Javascript等前端技術,融入最新的HTML5、CSS3結構設計,優化UI的整體表現。數據處理使用PHP和 javascript。使用PHP語言的MongoDB驅動連接數據庫,獲取數據庫中相應的數據,格式化成json數據之后再送給前端的javascript層。Javascript與前臺界面經行交互,控制前臺界面的展示效果。數據報表部分是整個網站展示端的核心,主要用戶想用戶展示各種類型的統計分析數據。包括柱狀圖、折線圖、餅圖等。圖形的繪制使用開源項目Highcharts。Highcharts是一個使用純javascript編寫的圖標庫,可以便捷的在WEB網站顯示交互性的圖表。
參考文獻
[1] 譚磊.New Internet:大數據挖掘[M].北京:電子工業出版社,2013(2):13.
[2] 艾榮榮.基于電信統計分析平臺的關鍵性指標分析系統設計與實現[D].西安:西安電子科技大學,2010.2-4.
統計數據分析范文6
在我國經濟結構調整和轉型升級的時代背景下,高等學校通過產學研合作服務社會的功能和實現方式迫切需要轉型升級。如2015年通過的《中華人民共和國促進科技成果轉化法》修訂稿,2016年國務院出臺的“實施《中華人民共各國促進科技成果轉化法》若干規定等,表明國家對成果轉化的高度重視,而技術合同經費作為技術轉移轉化的一個重要指標,該指標可以體現一個學校技術轉移轉化的活躍度及市場價值。本文試圖以江蘇涉農高校近3年技術合同經費情況以來找到我校與其他高校的差距,并提出方法與對策。
1 近3年統計數據(萬元)
數據分析:
1)根據省技術市場提供的數據,高校納入統計的學校共計41所,大部分是理工類的學?;蚓C合性大學,涉農高校共4所,南農,南林、揚大、江南。綜合3年來看,我們幾年都逐年進步,但和江南大學和揚州大學差距還是比較大.在技術轉讓上,我校的數據并不落后,但在技術開發上差距較大,這點,我們和林大比較相似,主要數據貢獻體現在技術咨詢和技術服務上,也體現農業或林業技術的公益性強的特點。但我校的技術轉讓又遠超過林大,說明我們科研實力還是遠超對方的。
2)技術開發少,一個是項目少,二是單項開發合同額也少。項目少說明我校參與社會服務或者說與企業的合作還是小眾行為的,合同額小說明農業技術開發相比工業技術來說要價更低,這也是體現了農業技術商品化的特點。主要原因,可能是我校對于合同科研沒有進行一定的考量。相對于縱向經費來說,橫向經費不僅難拿而且在項目實現過程中付出時間和其他成本更高。有能力從事社會服務或進行合同科研的團隊往往優先可能會考慮申請縱向項目,而且普通科研教師,往往縱向和橫向機會都很少。
3)從客觀上講,揚大和江南大學經過并校及所在城市的關系,都已經成為綜合性大學,無論在師資、學科數及規模上都超過我們學校。揚大和江南大學都有不少理工科的學科,江南大學以前更是輕工類學科強校,除食品學院外,其余大部都是理工科,而且都擁有科技園。我校目前的發展方向中世界一流農業大學,行業性大學發展,這點和南林有點相似。
4)起步較晚,重視度不夠。2012年執行新的對外服務管理方法后,我校的合同額無論從數量和總額上都有了明顯的提高,從2012年占揚大總額1/7,到2014年也占到揚大的1/4左右。但經過這兩年運作之后,也有一個明顯的問題,就是后續無力,既無科技園又無孵化器。
5)在機構上,揚大有社會合作與服務處與科技處科技成果推廣科統共同負責社會服務與產學研工作,科技處主要負責各類產學研相關的項目管理,社會處主要負責各類平臺的搭建。江南大學在管理上項目管理主要科研院內成果處和江大技術工程公司,平臺搭建主要在產業技術研究院。
2 方法與對策
1)機構整合,把產學研處和成果處進行整合,從成果的源頭進行,實現專利申請、持有、轉化一條龍服務。另外一種模式,推廣與轉化一體化。在新成果新技術的推廣過程,完成轉化的過程。
2)在成果轉化上,尤其是需要有產出的產學研合作,就要加強與農藥企業、肥料企業、飼料企業、種子企業、農機企業等合作,這類企業在生產中能做到標準化、規模化、技術保密性強、產品明確、科研投入大、知識產權交易清晰,技術投入對于的企業的經營有著明確的影響的。主要是有涉及生產工藝或生產線的農資類企業。
3)要設立種子基金或者概念證明基金,以解決科研成果與企業產品開發之間的“死亡之谷”因為大學與企業本質的不同,所以大學和企業在技術發展和推銷階段信息、動機的不對稱以及科學、技術和商業企業存在的制度距離,構成了大學研究成果走向市場的障礙。這個目前國家主要通過孵化器和科技園及一些配套的政策來解決。但目前高校如果沒有相應的孵化器或科技園。可以先通過種子基金來扶持一批有商業化前景的成果來進行深入開發。
4)成立涉農科技企業的孵化器。與工業或其他領域的孵化器相比。涉農科技企業有其獨特的要求。對于土地或實驗基地有著一定的要求?,F在工業項目的孵化器比較多,專門為農業的很少。
5)尤其是大的學科組,設立兼職的技術經濟人。進行一系列的培訓。可以負責所在學科組或學院的成果挖掘和技術交易等相關事務,可以通過工作量或交易額提成的方式進行激勵。
6)繼續建立技術轉移中心。利用地方的資源進行有效的布點,深入了解地方的企業科技需求狀態。篩選有效信息,促進高校教師或學科團隊與地方及企業的合作。促進學校科研成果的轉化及獲得更多科研經費投入。
7)充分利用網絡平臺,現在各類技術交易平臺比較多,要選擇一些比較活躍的、有政府背景平臺,尤其針對農業技術和農業企業的更好,作為我們成果轉化的有效平臺。
8)轉化模式要多樣化。在知識產權管理方法的允許下,我們要更多以債權或股權的方式進行轉化。和資產經營公司和各類投資公司合作,進行以商業化為目標的成果轉化。