Prophet时间序列预测——python和R语言实现_prophet python-程序员宅基地

技术标签: 预测算法  

一、Prophet概述

Prophet是一种基于可加性模型预测时间序列数据的程序,其中非线性趋势可以按年度、每周和每日的季节性,以及假日效应进行拟合。它最适合于具有强烈季节效应的时间序列和有几个季节的历史数据。Prophet对于缺失的数据和趋势的变化是稳健的,并且通常能够很好地处理异常值。

模型原理:
Prophet模型如下:
在这里插入图片描述
g(t) 表示趋势函数,拟合非周期性变化;
s(s)表示周期性变化,比如说每周,每年,季节等;
h(t)表示假期变化,节假日可能是一天或者多天;
ϵt为噪声项,用他来表示随机无法预测的波动,我们假设ϵt是高斯的。

  1. 趋势中有两个增长函数,分别是分段线性函数(linear)和非线性逻辑回归函数(logistic)拟合增长曲线趋势。通过从数据中选择变化点,Prophet自动探测趋势变化;
  2. 使用傅里叶级数建模每年的季节分量;
  3. 使用虚变量代表过去,将来的相同节假日,属于节假日就为1,不属于就是0;
  4. 用户提供的重要节假日列表

prophet的预测过程:

  1. Modeling:建立时间序列模型。分析师根据预测问题的背景选择一个合适的模型。
  2. Forecast Evaluation:模型评估。根据模型对历史数据进行仿真,在模型的参数不确定的情况下,我们可以进行多种尝试,并根 据对应的仿真效果评估哪种模型更适合。
  3. Surface Problems:呈现问题。如果尝试了多种参数后,模型的整体表现依然不理想,这个时候可以将误差较大的潜在原因呈现给分析师。
  4. Visually Inspect Forecasts:以可视化的方式反馈整个预测结果。当问题反馈给分析师后,分析师考虑是否进一步调整和构建模型。

Prophet适用场景:

  1. 有至少几个月(最好是一年)的每小时、每天或每周观察的历史数据;
  2. 有多种人类规模级别的较强的季节性趋势:每周的一些天和每年的一些时间;
  3. 有事先知道的以不定期的间隔发生的重要节假日(比如国庆节);
  4. 缺失的历史数据或较大的异常数据的数量在合理范围内;
  5. 有历史趋势的变化(比如因为产品发布);
  6. 对于数据中蕴含的非线性增长的趋势都有一个自然极限或饱和状态。

传统的时间序列预测,适用的时序数据过于局限, 缺失值需要处理,模型缺乏灵活性,指导作用较弱;

Prophet优点:

  • 准确,快速,拟合非常快,可以进行交互式探索
  • 全自动,无需人工操作就能对混乱的数据做出合理的预测
  • 可调整的预测,预测模型的参数非常容易解释,可以用业务知识改进或调整预测
  • 对缺失值和变化剧烈的时间序列和离散值能做很好有很好的鲁棒性,不需要填补缺失值;

二、Prophet安装

在anaconda中安装prophet模块,以管理员权限运行命令窗口,执行以下命令

conda install -c conda-forge fbprophet

中间可能会遇到需要暗转或者更新一些依赖模块,输入y回车就行,因为之前我运行的时候已经更新,但是不是管理员权限,所以安装失败,我重新以管理员运行命令,就安装成功了。
在这里插入图片描述

三、Prophet应用

R语言实现

mydata<-read.table("C:\\Users\\examples\\example_wp_log_peyton_manning.csv",header=TRUE,sep=",") 
head(mydata)
m <- prophet(mydata)
future <- make_future_dataframe(m,periods=365)    #####需要剩下的预测天数,如果预测的数据是月份加上参数freq='month'
#预测数据集
forecast <- predict(m,future)
plot(m, forecast)

在这里插入图片描述
可以画出预测的成分图

prophet_plot_components(m, forecast)

其中trend是增长模型的展示,weekly和yearly部分是季节性模型的展示

在这里插入图片描述

在这里插入图片描述

由于prophet是加法模型,有:
forecast[‘additive_terms’] = forecast[‘weekly’] + forecast[‘yearly’];
forecast[‘yhat’] = forecast[‘trend’] + forecast[‘additive_terms’] 。
因此:forecast[‘yhat’] = forecast[‘trend’] +forecast[‘weekly’] + forecast[‘yearly’]。
加上节假日因素:
forecast[‘yhat’] = forecast[‘trend’] +forecast[‘weekly’] + forecast[‘yearly’] + forecast[‘holidays’]。
‘multiplicative_terms’, ‘multiplicative_terms_lower’, 'multiplicative_terms_upper’这3列是乘法模型的因素,所以为空。

增加假期的影响
lower_window 和 upper_window 表示节假日的区间,其中包含前一天,就设置 lower_window = -1 , upper_window = 0 ,
表示包含后一天,就设置 lower_window = 0 , upper_window =1

playoffs <- data.frame(
  holiday = 'playoff',
  ds = c('2008-01-13', '2009-01-03', '2010-01-16',
         
         '2010-01-24', '2010-02-07', '2011-01-08',
         
         '2013-01-12', '2014-01-12', '2014-01-19',
         
         '2014-02-02', '2015-01-11', '2016-01-17',
         
         '2016-01-24', '2016-02-07'),
  lower_window = 0,
  upper_window = 1)
 m <- prophet(mydata,holidays =playoffs)
future <- make_future_dataframe(m,periods=365)    #####需要剩下的预测天数,如果预测的数据是月份加上参数freq='month'
#预测数据集
forecast <- predict(m,future)
prophet_plot_components(m, forecast) #成分图
plot(m, forecast)#预测图

在这里插入图片描述

python实现

import pandas as pd
from fbprophet import Prophet
#读取数据集
df=pd.read_csv('C:\\Users\\examples\\example_wp_log_peyton_manning.csv')
#拟合模型
m=Prophet()
m.fit(df)
#构建待预测日期数据框,periods=365 代表除历史数据的日期外再往后推365天
future=m.make_future_dataframe(periods=365) #包含历史数据,如果是月度数据make_future_dataframe(periods=9, freq='M')
#预测数据集
forecast=m.predict(future)
#展示预测结果
m.plot(forecast);
#预测的成分分析绘图,展示预测中的趋势、周效应和年度效应
m.plot_components(forecast);

增加节假日信息

playoffs=pd.DataFrame({
    'holiday':'playoff',
    'ds':pd.to_datetime(['2008-01-13', '2009-01-03', '2010-01-16',
         
         '2010-01-24', '2010-02-07', '2011-01-08',
         
         '2013-01-12', '2014-01-12', '2014-01-19',
         
         '2014-02-02', '2015-01-11', '2016-01-17',
         
         '2016-01-24', '2016-02-07']),
      'lower_window':0,
    'upper_window':1,})
superbowls=pd.DataFrame({
    'holiday':'superbowl',
    'ds':pd.to_datetime(['2010-02-07', '2014-02-02', '2016-02-07']),
    'lower_window':0,
    'upper_window':1,    
})
holidays=pd.concat((playoffs,superbowls))
m=Prophet(holidays=holidays)
m.fit(df)
future=m.make_future_dataframe(periods=365)
forecast=m.predict(future)
fig=m.plot_components(forecast)

在这里插入图片描述

四、关于参数调整

  1. 首先我们去除数据中的异常点(outlier),直接赋值为none就可以,因为Prophet的设计中可以通过插值处理缺失值,但是对异常值比较敏感。
  2. 选择趋势模型,默认使用分段线性的趋势,但是如果认为模型的趋势是按照log函数方式增长的,可设置growth='logistic’从而使用分段log的增长方式
  3. 设置趋势转折点(changepoint),如果我们知道时间序列的趋势会在某些位置发现转变,可以进行人工设置,比如某一天有新产品上线会影响我们的走势,我们可以将这个时刻设置为转折点。
  4. 设置周期性,模型默认是带有年和星期以及天的周期性,其他月、小时的周期性需要自己根据数据的特征进行设置,或者设置将年和星期等周期关闭。
  5. 设置节假日特征,如果我们的数据存在节假日的突增或者突降,我们可以设置holiday参数来进行调节,可以设置不同的holiday,例如五一一种,国庆一种,影响大小不一样,时间段也不一样。
  6. 此时可以简单的进行作图观察,然后可以根据经验继续调节上述模型参数,同时根据模型是否过拟合以及对什么成分过拟合,我们可以对应调节seasonality_prior_scale、holidays_prior_scale、changepoint_prior_scale参数。
  7. 如果预测结果的误差很大,考虑选取的模型是否准确,尝试调整增长率模型(growth)的参数,在必要的情况下也需要调整季节性(seasonality)参数。
  8. 如果在尝试的大多数方法中,某些日期的预测依然存在很大的误差,这就说明历史数据中存在异常值。最好的办法就是找到这些异常值并剔除掉。使用者无需像其他方法那样对剔除的数据进行插值拟合,可以仅保留异常值对应的时间, 并将异常值修改为空值(NA),模型在预测时依然可以给出这个时间点对应的预测结果。
  9. 如果对历史数据进行仿真预测时发现,从一个截点到下一个截点误差急剧的增加,这说明在两个截点期间数据的产生过程发生了较大的变化,此时两个截点之间应该增加一个”changepoint”,来对这期间的不同阶段分别建模。

参考资料:https://blog.csdn.net/qq_23860475/article/details/81354467
https://blog.csdn.net/anshuai_aw1/article/details/83412058

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qingsi11/article/details/112259982

智能推荐

React学习记录-程序员宅基地

文章浏览阅读936次,点赞22次,收藏26次。React核心基础

Linux查磁盘大小命令,linux系统查看磁盘空间的命令是什么-程序员宅基地

文章浏览阅读2k次。linux系统查看磁盘空间的命令是【df -hl】,该命令可以查看磁盘剩余空间大小。如果要查看每个根路径的分区大小,可以使用【df -h】命令。df命令以磁盘分区为单位查看文件系统。本文操作环境:red hat enterprise linux 6.1系统、thinkpad t480电脑。(学习视频分享:linux视频教程)Linux 查看磁盘空间可以使用 df 和 du 命令。df命令df 以磁..._df -hl

Office & delphi_range[char(96 + acolumn) + inttostr(65536)].end[xl-程序员宅基地

文章浏览阅读923次。uses ComObj;var ExcelApp: OleVariant;implementationprocedure TForm1.Button1Click(Sender: TObject);const // SheetType xlChart = -4109; xlWorksheet = -4167; // WBATemplate xlWBATWorksheet = -4167_range[char(96 + acolumn) + inttostr(65536)].end[xlup]

若依 quartz 定时任务中 service mapper无法注入解决办法_ruoyi-quartz无法引入ruoyi-admin的service-程序员宅基地

文章浏览阅读2.3k次。上图为任务代码,在任务具体执行的方法中使用,一定要写在方法内使用SpringContextUtil.getBean()方法实例化Spring service类下边是ruoyi-quartz模块中util/SpringContextUtil.java(已改写)import org.springframework.beans.BeansException;import org.springframework.context.ApplicationContext;import org.s..._ruoyi-quartz无法引入ruoyi-admin的service

CentOS7配置yum源-程序员宅基地

文章浏览阅读2w次,点赞10次,收藏77次。yum,全称“Yellow dog Updater, Modified”,是一个专门为了解决包的依赖关系而存在的软件包管理器。可以这么说,yum 是改进型的 RPM 软件管理器,它很好的解决了 RPM 所面临的软件包依赖问题。yum 在服务器端存有所有的 RPM 包,并将各个包之间的依赖关系记录在文件中,当管理员使用 yum 安装 RPM 包时,yum 会先从服务器端下载包的依赖性文件,通过分析此文件从服务器端一次性下载所有相关的 RPM 包并进行安装。_centos7配置yum源

智能科学毕设分享(算法) 基于深度学习的抽烟行为检测算法实现(源码分享)-程序员宅基地

文章浏览阅读828次,点赞21次,收藏8次。今天学长向大家分享一个毕业设计项目毕业设计 基于深度学习的抽烟行为检测算法实现(源码分享)毕业设计 深度学习的抽烟行为检测算法实现通过目前应用比较广泛的 Web 开发平台,将模型训练完成的算法模型部署,部署于 Web 平台。并且利用目前流行的前后端技术在该平台进行整合实现运营车辆驾驶员吸烟行为检测系统,方便用户使用。本系统是一种运营车辆驾驶员吸烟行为检测系统,为了降低误检率,对驾驶员视频中的吸烟烟雾和香烟目标分别进行检测,若同时检测到则判定该驾驶员存在吸烟行为。进行流程化处理,以满足用户的需要。

随便推点

STM32单片机示例:多个定时器同步触发启动_stm32 定时器同步-程序员宅基地

文章浏览阅读3.7k次,点赞3次,收藏14次。多个定时器同步触发启动是一种比较实用的功能,这里将对此做个示例说明。_stm32 定时器同步

android launcher分析和修改10,Android Launcher分析和修改9——Launcher启动APP流程(转载)...-程序员宅基地

文章浏览阅读348次。出处 : http://www.cnblogs.com/mythou/p/3187881.html本来想分析AppsCustomizePagedView类,不过今天突然接到一个临时任务。客户反馈说机器界面的图标很难点击启动程序,经常点击了没有反应,Boss说要优先解决这问题。没办法,只能看看是怎么回事。今天分析一下Launcher启动APP的过程。从用户点击到程序启动的流程,下面针对WorkSpa..._回调bubbletextview

Ubuntu 12 最快的两个源 个人感觉 163与cn99最快 ubuntu安装源下包过慢_un.12.cc-程序员宅基地

文章浏览阅读6.2k次。Ubuntu 12 最快的两个源 个人感觉 163与cn99最快 ubuntu下包过慢 1、首先备份Ubuntu 12.04源列表 sudo cp /etc/apt/sources.list /etc/apt/sources.list.backup (备份下当前的源列表,有备无患嘛) 2、修改更新源 sudo gedit /etc/apt/sources.list (打开Ubuntu 12_un.12.cc

vue动态路由(权限设置)_vue动态路由权限-程序员宅基地

文章浏览阅读5.8k次,点赞6次,收藏86次。1.思路(1)动态添加路由肯定用的是addRouter,在哪用?(2)vuex当中获取到菜单,怎样展示到界面2.不管其他先试一下addRouter找到router/index.js文件,内容如下,这是我自己先配置的登录路由现在先不管请求到的菜单是什么样,先写一个固定的菜单通过addRouter添加添加以前注意:addRoutes()添加的是数组在export defult router的上一行图中17行写下以下代码var addRoute=[ { path:"/", name:"_vue动态路由权限

JSTL 之变量赋值标签-程序员宅基地

文章浏览阅读8.9k次。 关键词: JSTL 之变量赋值标签 /* * Author Yachun Miao * Created 11-Dec-06 */关于JSP核心库的set标签赋值变量,有两种方式: 1.日期" />2. 有种需求要把ApplicationResources_zh_CN.prope

VGA带音频转HDMI转换芯片|VGA转HDMI 转换器方案|VGA转HDMI1.4转换器芯片介绍_vga转hdmi带音频转换器,转接头拆解-程序员宅基地

文章浏览阅读3.1k次,点赞3次,收藏2次。1.1ZY5621概述ZY5621是VGA音频到HDMI转换器芯片,它符合HDMI1.4 DV1.0规范。ZY5621也是一款先进的高速转换器,集成了MCU和VGA EDID芯片。它还包含VGA输入指示和仅音频到HDMI功能。进一步降低系统制造成本,简化系统板上的布线。ZY5621方案设计简单,且可以完美还原输入端口的信号,此方案设计广泛应用于投影仪、教育多媒体、视频会议、视频展台、工业级主板显示、手持便携设备、转换盒、转换线材等产品设计上面。1.2 ZY5621 特性内置MCU嵌入式VGA_vga转hdmi带音频转换器,转接头拆解

推荐文章

热门文章

相关标签