摘要:國網甘肅省電力公司經濟技術研究院楊國山團隊在《 電力需求側管理 》發表論文《 基于深度強化學習算法的儲能系統盈利策略研究 》,針對高比例新能源接入背景下儲能系統成本高、盈利難
國網甘肅省電力公司經濟技術研究院楊國山團隊在《電力需求側管理》發表論文《基于深度強化學習算法的儲能系統盈利策略研究》,針對高比例新能源接入背景下儲能系統成本高、盈利難的問題,創新性地提出了一種融合最小二乘支持向量機(LSSVM)與深度強化學習(DDPG)的智能盈利策略。該研究通過引入電網激勵因子,實現了儲能運營商在多變的電力市場中進行利潤最大化與電網削峰填谷的雙贏,為儲能產業的商業化運營提供了新范式。

隨著風能、太陽能等波動性新能源的大規模并網,儲能系統作為平抑波動、削峰填谷的關鍵技術,其經濟性卻常受限于高昂的建設和運維成本。傳統數學模型難以應對電價與負荷需求的不確定性,導致盈利策略往往陷入局部最優。為此,研究團隊構建了從預測到決策的全鏈條解決方案。
在核心技術層面,團隊首先利用LSSVM算法對電價和負荷進行高精度預測,為決策提供可靠依據。隨后,引入深度確定性策略梯度(DDPG)算法,結合Q-learning機制,讓儲能系統在與電力市場的“博弈”中自主學習最優充放電策略。特別值得一提的是,該研究設計了獨特的“激勵因子”,根據不同時間段的電網負荷壓力動態調整獎勵機制,引導儲能系統在電網峰值時多放電、谷值時多充電。
案例分析基于美國PJM電力市場數據進行驗證。結果顯示,相較于未引入激勵的傳統策略,該策略顯著提升了儲能運營商的收益。在電網側,實施激勵策略后,峰值供電壓力降低了30.3%,有效緩解了電網負荷緊張局面。這表明,通過智能算法與激勵機制的結合,儲能系統不僅能實現自我“造血”,還能成為電網安全穩定運行的“調節器”,為未來電力市場的機制設計提供了極具價值的參考。
聲明:
①文獻來自知網、維普、萬方等檢索數據庫,說明本文獻已經發表見刊,恭喜作者.
②如果您是作者且不想本平臺展示文獻信息,可聯系學術顧問予以刪除.