bt 另类 专区 欧美 制服-brazzers欧美精品-blz在线成人免费视频-blacked黑人战小美女-亚洲欧美另类日本-亚洲欧美另类国产

大數據的大用戶用電需求控制模型

前言:尋找寫作靈感?中文期刊網用心挑選的大數據的大用戶用電需求控制模型,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。

大數據的大用戶用電需求控制模型

摘要:在電改背景下,業擴報裝業務既是提高供電服務水平的關鍵一環,也是拉升電網資產利用率的重要一步。多項電力因素影響著業擴報裝需求的確定,但目前在大用戶電力報裝的過程中設備容量等參數大多采用經驗預估的方式,此方式可能出現以下兩種情形:電網預留容量不足而導致無法滿足實際需求,或預留容量過大而導致電網設備利用率低。本文從兩個方向開展大用戶用電需求預測,精準量化用電需求:(1)從大用戶級別構建基于大數據的電力大用戶業擴報裝需求容量測算模型,通過數據模型預估報裝需求;(2)從用電類別出發計算不同用電類別下的需要系數和同時系數,對大用戶供電需求進行預測。

關鍵詞:業擴報裝;容量測算模型;需要系數;同時系數

業擴報裝業務泛指從客戶提交用電申請需求至實際成功用電的該段電力企業業務流程,其具體過程包括客戶申請的確認、供電方案的確認、供電合同的確認以及最終的裝表供電。該業務將電力企業與用戶之間的供用電關系緊密連接。用戶在最終的裝表供電完成后,一般會經歷一段時間的周期負荷調整過程,隨著時間推移電量顯著提升,直至用電維持在一個穩定的合理的區間。業擴報裝業務具有以下方面的特性:一是具有確切的目的性,其目的是提供給到客戶安全、穩定以及經濟的用電服務。二是具有較強的時間緊迫性,供電公司需在最短時間內為客戶提供送電服務,其對供電公司在業務流程和進度管理上要求頗高。三是具有多對一的響應關系,多個客戶對接同一家供電公司的情況普遍存在。四是具有多部門協同合作性,該業務牽涉供電公司多個部門的多個業務,不同部門間的協作能力及部門溝通尤為重要。五是具有用電需求的復雜性,不同類型的用電客戶存在不同的用電需求,及時滿足多樣的客戶需求對供電公司提出了更高的要求。在電改背景下,業擴報裝業務既是提高供電服務水平的關鍵一環,也是拉升電網資產利用率的重要一步。多項電力因素影響著業擴報裝需求的確定,設備容量等參數預留大多采用經驗預估的方式,這既可能因為電網預留容量不足導致電力供應不能滿足實際需求,也有可能因為預留容量過大使得電網設備利用率較低。故本文從兩個方向開展大用戶用電需求預測,實現精準量化大用戶業擴報裝需求,以更好提升客戶用電滿意度和電網設備利用率。(1)構建基于大數據的電力大用戶業擴報裝需求容量測算模型,通過數據模型量化報裝需求。(2)從用電類別出發計算不同用電類別下的需要系數和同時系數,對大用戶供電需求進行預測。

1大用戶級別業擴報裝預測模型

大用戶級別業擴報裝需求控制模型研究包括以下方面:(1)確定和業務研究目標相關的影響特征。(2)確定研究的模型。(3)進行數據探索和特征工程。(4)構建需求控制模型,并驗證模型結果。

1.1影響特征表

采集某地區共計350戶專線大用戶作為研究對象,搭建大用戶業擴報裝需求模型。基于業務特征,盡可能列舉出對業擴報裝有影響的所有因素,共計14個特征。(1)用戶信息:包括戶名、戶號、行業類別、人員數量、注冊資金和區域。(2)用電信息:包括用電類別、供電電壓等級和電源點個數。(3)電力數據:包括每日最大負荷、用電量和容量。(4)經濟數據:包括行業GDP。

1.2大數據模型處理方法

本文采用多種機器學習模型方法實現對大用戶用電需求控制模型的研究,主要采用多元線性回歸,k近鄰法和集成學習算法等回歸模型實現對用電需求進行預測分析。

1.2.1多元線性回歸模型:多元線性回歸模型一般是指利用數學手段整合多個自變量的信息去預估因變量的變化趨勢。多元線性回歸模型的通用數學表達式為,矩陣表達式為,其中01122...ppy=β+βx+βx++βx+εy=xβ+ε

1.2.2k近鄰回歸模型:k近鄰回歸模型是指利用該樣本周圍最接近的k個樣本的屬性去預測該樣本的值。一般采用平均值或者平均法來定義該樣本的輸出。同時樣本的分布規律決定了k值的選擇方向,而k值的選擇也影響了模型的結果:一種是較小的k值導致訓練誤差的降低和泛化誤差的加大,另一種是較大的k值導致訓練誤差的增大和泛化誤差的降低。

1.2.3集成學習回歸模型:集成學習算法是一種將來自多個機器學習算法的預測值結合在一起的技術,比任何單獨模型做出的預測更為準確。本文集成學習模型涉及Bagging和隨機森林兩類回歸模型。Bagging:Bagging從Bootstrap和Aggregating兩詞結合而來,其算法邏輯是從訓練集中通過有放回采樣的方式獲得不同的子訓練集,在不同的子訓練集上獨立訓練出多個不同的弱學習器,將多個弱學習器的結果進行一定的整合,以此作為最終的預測值。Bagging可以并行地訓練多個不同的弱學習器,并行的特性可以提高模型的運算速度。回歸問題的結果整合可采用均值方法。有放回采樣的方式可自動實現將63%的樣本作為訓練集,而剩下的樣本作為驗證集。Bagging最明顯的優勢是可用來降低模型的方差.隨機森林:隨機森林繼承了Bagging模型的基本思想,但對Bagging進行了兩處改進:(1)其將決策樹作為弱學習器,因為決策樹是不穩定學習器,故適合進行Bagging操作。(2)同時對特征進行隨機采樣而形成特征子集,避免過擬合,以此增加各子決策樹間的差異性。隨機森林的優勢體現在以下幾點:一是對大規模數據集具有良好的性能;二是對高維特征具有較好的處理能力而無須進行降維操作;三是對于特征中的缺省值不敏感,具有較好的魯棒性。回歸問題的結果整合可采用均值方法。

1.3數據探索和特征工程

1.3.1相關性分析。變量間的相關性分析是將特征變量和目標變量間的線性關聯進行直觀體現,其計算的相關系數結果可作為特征工程中提取特征項目的依據。通過皮爾遜相關系數可直觀查看變量間的關聯,其衡量的是線性關系的強度和方向。假設有兩個特征x和y,按照以下方式比較他們的每個元素,從而計算皮爾遜相關系數:其中。相關性圖譜是展現相關性分析結果較好的圖形之一,獲得特征間的相關性圖譜如圖2所示。

1.3.2特征處理。特征處理包含兩個步驟:一是數據的無量綱化,二是定性特征進行啞變量編碼。(1)數據無量綱化:由于各數值變量的尺度不同,故需要通過數據無量綱化標準化以消除量綱影響。無量綱化可以使模型的收斂速度加快,縮短模型的運行耗時。標準化是指通過計算特征的均值和標準差,對特征矩陣的各列數據進行如下公式的處理過程。公式為,其中X是特征矩陣的均值,S為特征矩陣的標準差。(2)啞變量通常是指人為虛設的變量,取值為0和1,用來反映某個變量的不同屬性特點。啞變量編碼是將類別變量轉換為啞變量,也就是將定性變量進行了量化處理。引入啞變量的目的即是為了評測定性變量對預測結果的影響。對人員數量進行有序編碼,對電源點個數變量進行指定編碼,對電壓等級、行業類型和用電類別進行虛擬編碼。

1.3.3特征選擇。特征選擇是指在映射函數作用下直接將不重要的特征刪除而抓住主要影響因子的過程。變量越少越有利于分析,對模型結果的可解釋性越高。本文的特征選擇方法是包裝法,其算法邏輯是用遞歸特征消除法來達到篩選重要因子的目的。遞歸特征消除法是指在特征空間中抽取特征子集,在特征子集上構建相應模型,迭代該過程,遍歷所有特征空間,通過模型結果來篩選表現最佳的特征子集。最終進入模型的特征有35個,為’電源點個數’,’注冊資金(人民幣:萬)’,’規模(人員數量)’,’用戶達到最大負荷年數’,’用電量’,’行業GDP’,’容量’,’電壓等級1’,’電壓等級2’,’電壓等級3’,’電壓等級4’,’區域1’,’區域2’,’區域3’,’區域4’,’區域5’,’區域6’,’區域7’,’區域8’,’區域9’,’區域10’,’區域11’,’區域12’,’區域13’,’區域14’,’行業類型1’,’行業類型2’,’行業類型3’,’行業類型4’,’行業類型5’,’用電類別1’,’用電類別2’,’用電類別3’,’用電類別4’,’用電類別5’。模型依據交叉驗證得分選擇的特征如圖3所示。

1.4模型構建

基于大用戶電量歷史需求、用電特征和行業特征等數據,使用特征工程、回歸、決策樹等機器學習方法,挖掘大用戶電力需求,提取業擴報裝大用戶有效用電特征,將其作為模型輸入特征,建立大用戶業擴報裝需求模型,量化輸出大用戶業擴報裝容量需求。在對比多個模型精度后發現,多元線性回歸的精度高于其他模型算法,但整體精度仍然不高。

1.4.1多元線性回歸模型:多元線性回歸模型的預測精度,也就是R2達到0.712,也就是模型可以解釋71.2%的變量。

1.4.2k近鄰回歸模型:選擇k=20,模型的精度為0.564,預測效果一般。

1.4.3集成學習回歸模型:通過構建單個回歸樹、Bagging回歸樹和隨機森林進行對比,發現集成算法會降低測試誤差,Bagging和隨機森林的測試誤差基本一致,但是測試誤差依然在0.88左右。從隨機森林的輸入變量重要性來看,區域11的用電量、容量以及用戶達到最大負荷的年數等變量重要性高于其他變量,和特征選擇的結果一致。

2用電類別下供電需求預測

在基于大用戶級別的報裝預測的同時,可以通過用電類別下的需要系數和同時系數的計算來對不同的用電類別用戶進行容量預測。算法邏輯為:一是依據用電性質將用戶進行分類,獲得不同用電類別下的歷史最大負荷值,從而計算各用戶不同的需要系數;二是用全行業歷史最大負荷值和第一步中的用電類別下歷史最大負荷值來計算全社會同時系數。需要系數和同時系數可用于電力大用戶業擴報裝負荷預測。

2.1需要系數分析

a.根據用電性質將用戶分為工業用戶、商業用戶和公共服務用戶3類;其中公共服務用戶包含非工業、非居民照明和享受居民類用戶;住宅小區用戶數較少,低于10戶,故忽略不計。b.用戶用電數據的采樣時間間隔取15分鐘。c.被提取的用戶的配變安裝時間為超過8年,也就是安裝日期不晚于2012年12月31日。本文統計時間段為2018年1月至2020年12月,滿足以上條件的大用戶如下:工業用戶46戶,商業用戶46戶,公共服務用戶81戶。用電類別的需要系數的算法邏輯是該用電類別的最大負荷值與用電類別下用戶的容量匯總之比。需要系數公式為:,其中Lmax為該用電類別的最大負荷值,N為該用電類別的用戶總數,∂為需要系數,Qi為用電類別下第i個用戶的容量。經計算某市的公共服務用戶的需要系數較低,僅為0.136;工業用戶的需要系數最高,達到0.930。

2.2全行業同時系數分析

全行業同時系數的算法邏輯是將全行業最大負荷值和各用電類別對應的最大負荷值作為全行業同時系數計算的分子和分母。公式為:,其中Lj為第j類別用戶的最大負荷值,Hmax指全行業最大負荷值,δ指同時系數。某市的全行業同時系數的計算結果達到0.932。

2.3供電需求預測

a.各用電類別供電需求:利用各用電類別需要系數和容量去估計待預測區域各用電類別的供電需求。b.區域供電需求:結合全行業同時系數,估計出待預測區域的供電需求。區域供電需求公式為:,其中δ為同時系數,Qj為第j種用電類別的容量,∂j指第j種用電類別對應的需要系數值。

3結論

本文通過兩種方式給出了業擴報裝容量的預測方向。一是構建了業擴報裝容量的多種模型預測方法,特征選擇后進行了多種模型結果嘗試。后續可在收集的數據量級及數據獲取的準確性上進行進一步擴展分析。二是通過用電類別集合下的需要系數和同時系數的計算,將用戶集成到不同用電類別下進行對照預測,用計算獲取的需要系數值和全社會的同時系數值來估計待預測區域的供電需求。

作者:彭茁 王翔 李勇濤 單位:國網合肥供電公司

主站蜘蛛池模板: 色综合91久久精品中文字幕 | 国产在线观看入口 | 国产女人成人精品视频 | 国产91久久精品一区二区 | 欧美高清在线精品一区二区不卡 | 一区二区三区免费在线 | 欧美成a人片在线观看 | 黄视频网站在线看 | 国产日韩欧美中文 | 日韩专区第一页 | 欧美日本道免费二区三区 | 成人欧美一区二区三区黑人 | 日韩大片免费观看视频播放 | 久久精品a国产一级 | 欧美视频亚洲视频 | 欧美日韩一区二区三区在线播放 | 国产在线观看一区二区三区 | 国产亚洲一区二区三区不卡 | 国语视频 | 国语清晰对白声音刺激 | www.91麻豆 | 国产成人青青热久免费精品 | 日韩精品在线视频 | 欧美日韩精品一区二区视频在线观看 | 亚洲一区二区三区在线免费观看 | 在线视频一区二区 | 国产最新网址 | 欧美一区二区三区在线视频 | 91久久国产综合精品女同国语 | 免费一区二区视频 | 日韩电影院| 91精品欧美一区二区三区 | 日韩系列第一页 | 亚洲黄色一区二区 | 日韩在线观看一区二区三区 | 日韩亚洲欧洲在线com91tv | 国产亚洲精品成人婷婷久久小说 | 一级毛片免费网站 | 欧美精品三区 | 久久一区二区精品综合 | 午夜视频hd |