产品介绍

什么是百度预测开放平台?

百度预测开放平台依托百度在大数据领域的资源优势、技术优势、人才优势, 对外提供平台化预测服务,开放百度的大数据预测能力,让大数据辅助企业进行商业运营决策。

基于百度积累整合的各行业数据,包括百度搜索、新浪微博、互联网抓取、百度LBS以及线下第三方行业数据等, 自动探索、分析、预测大数据中与预测目标最相关的因素,并对预测目标建立时间序列分析、机器学习、大规模深度学习等模型, 以此来预测未来一段时间的结果。

典型应用场景

某旅游城市的酒店,希望预测未来2周的入住量,以便提前规划房间定价、营销策略、人员分工等工作。

酒店只要从其CRM系统中导出过去1~2年每天的入住量数据,将其上传到百度预测开放平台,并填写行业、 地域、关键词信息,提交预测任务;百度预测开放平台就会自动挖掘与酒店入住量相关的因素, 如该酒店的搜索指数、微博热度、舆情、酒店附近人流量等指标,并结合入住量数据自身的季节性、周末效应、 假日因素、中长期变化趋势等,建立大数据预测模型,来准确预测该酒店未来2周的入住量。

让酒店相关的部门可以对未来一定时间内的客流量做出相对准确的预估,并以此来合理安排相应的资源分配。

使用说明

一、登录百度预测开发平台

支持百度推广、百度联盟、百度统计、百度司南、百度信誉V认证、百度云账号登录。

登录示例

二、新建预测任务

请准确填写各项信息,有助于提高预测准确度。

历史数据支持上传日粒度及周粒度的时序数据,为保证预测准确可行,请上传至少30天(日粒度)/30周(周粒度)的历史数据,数据格式说明请下载数据模板查阅。

关键词:根据您的预测目标,提供恰当的关键词,有助于提高预测准确度。

新建任务

三、查看任务状态

提交任务后,可点击“全部任务”或者任务分组进入任务列表,查看任务计算状态。

查看状态

四、查看任务详情

任务计算完成后,可点击任务名称查看预测结果,预测结果可下载。

任务详情

常见问题

1. 百度预测开放平台是否收费

百度预测开放平台试运营期间可免费使用。百度推广用户、百度统计站长版用户、百度联盟用户、 百度司南用户、百度信誉V认证用户、百度企业云用户都可以直接登录使用。

2. 百度预测开放平台的适用范围

百度预测开放平台目前适用于日粒度的时序数据预测,未来会支持周粒度、月粒度。

3. 提交预测任务有什么限制

试运营期间,每个账号每天可以提交5个预测任务。

4. 百度预测开放平台可以预测未来多长时间的数据

上传的历史数据的时间跨度不同,可预测的时间不同;历史数据越多,可预测的时间越长。 历史数据时间跨度和可预测时长的对应关系如下:

历史数据时间跨度(日粒度) 可预测的天数
30~90天 1天
90~180天 3天
180~360天 7天
360天以上 14天
历史数据时间跨度(周粒度) 可预测的周数
30周-60周 1周
61周-90周 2周
91周-120周 3周
121周及以上 4周

5. 上传历史数据时,有哪些注意事项

(1)为保证数据文件的可用性,推荐使用数据模板上传。

(2)目前支持上传日粒度和周粒度的时序数据,文件格式为文本文件(.txt后缀)。

(3)文件分两列,第一列是日期,第二列是数据值,中间用tab分隔(从excel表格将数据复制到文本文件,直接就是tab分隔); 一个日期对应一个数据值,多个数据值请拆分成多个文件。

(4)日期请顺序输入,支持以下5种格式:2014/1/1、2014/01/01、2014-1-1、2014-01-01、20140101。

(5)若日期为周粒度,每两个日期之间需要相隔7天;周粒度日期表示从当前日期开始,往后的连续一周(7天)的数据;如:2013/1/7代表 2013/1/7~2013/1/13的周数据。

(6)为保证预测准确可行,请上传至少30天(天粒度)/30周(周粒度)的历史数据,数据缺失不超过10% (如:上传6个月/180天的历史数据,缺失天数不超过180*10% = 18天)。

(7)用数据模板上传历史数据时,请将开头的说明文字删除。

6. 关键词如何填写

关键词能准确描述预测任务即可,不是越多越好,举几个例子。

(1)预测北京喜来登长城饭店未来2周的入住量,关键词示例:北京喜来登长城饭店、北京喜来登、喜来登长城饭店。

(2)预测iPhone 5S手机未来2周的网络销量,关键词示例:iPhone 5S、苹果5S。

(3)预测北京到上海未来2周的航班出行人数,关键词示例:北京到上海、北京到上海的机票、北京到上海的航班。

7. 预测误差率是什么意思

在历史数据上进行验证,得出预测值偏离真实值的比率。误差率越小,表示准确度越高。

8. 下载数据后,格式不方便阅读怎么办

下载的数据默认是文本文件格式(.txt后缀),没有换行,可以全选复制到excel表格中查看。

API工具 - 使用说明

该工具基于百度预测开放平台技术,为您提供实时的预测任务发布、查询,以及管理功能;

特色

1.标准Cli工具,比平台操作更便捷;
2.免登陆,自动认证;
3.可以利用该工具将预测任务例行化(如:建立cronjob);

获取/安装

1.点击下载工具的链接(截图,线上入口截图),得到predict_xxx.zip
2.将下载好的工具解压到指定目录,以linux系统举例: unzip -o -d /tmp 
3.cd  /tmp&&./predict 
4.看到有帮助信息表示成功;

使用方法

1.参考./predict –h
2.子命令(新建/更新/查看),参考 ./predict {new, update,query} 
3.任务例行化:
    以”销量预测” 为例:
    /home/work/xiaoliang_history.txt为每天都会更新的待预测样本文件,我们目标是为样本文件建立每天例行的预测任务。
    任务名为:xiaoliang_yuce_XXX (XXX为当前日期)
    我们工具的绝对地址为:/home/work/predict/predict 
    建立cronjob方法如下:
    Sudo Crontab –e ,打开cronjob任务表,在末尾添加预测例行任务(例中为每天00:10分跑一次):
    10 00 * * * today=`date "+%Y-%m-%d"` && cd /home/work/
    && ./predict/predict new -n "xiaoliang_yuce_${today}" -f ./xiaoliang_history.txt