Java教程

时间序列数据简介

本文主要是介绍时间序列数据简介,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
  • tensorflow in practice

  • Introduction, A conversation with Andrew Ng

什么是序列模型?

所以我们要做什么

重点是序列模型的一部分,

也就是时间序列。

序列模型,如果可以的话

想象一系列随时间变化的数据。

可能是收盘价

对于证券交易所的股票,

也可能是天气。

可能是加利福尼亚某一天的阳光,

或者西雅图的雨有多大

在某一天,诸如此类的事情。

想象一下

一项数据更改

以及如何衡量它。

基本上任何类似电子表格的东西,

如果我有一个电子表格,我有一天

行和两列表示加利福尼亚的天气,

一个是关于西雅图天气的

我在西雅图的生活要比在加利福尼亚好,

然后我们会有一个新的网络来帮助我们建模。

完全正确。我们从

创建一个合成的数据序列,

这样我们就可以开始研究

在数据系列中常见的属性是

例如,数据是否具有季节性

6月比1月阳光明媚

或者11月比10月潮湿,

类似的东西。

这就是数据的季节性。

在某些情况下,

数据趋势

比如它是否真的不是趋势,尽管我们

能说它够奇怪吗

关于气候变化,

但就像股票一样,数据可能也有上升的趋势

随着时间或者向下,

当然还有随机因素

这使得噪音很难预测

你可以有季节性数据,

你的数据可以有趋势,

但是你也可以在这些数据上添加噪音。

所以周二的平均温度

在六月,加州的温度可能是85度,

可能是85。5度,

可能是84.5度。

所以你得到了数据中的噪音。

我们开始吧

看看可以使用的各种方法

统计上对机器学习有帮助

根据季节趋势和噪声预测数据。

在这门课的最后,

最酷的应用之一

就是用这些想法来模拟太阳黑子。

太阳黑子活动。是的。所以太阳黑子活动

真的很有趣

因为太阳

一个11年的周期

一些天文学家告诉我这是一个22年的周期,

实际上有两个11年的周期

就像依偎在一起。

我们会在这门课上解决这个问题吗?

这还有待观察。

你得学习

然后我们会看到,

但关键是你

一定要把握好季节

我们有数据测量

大约250年前的太阳黑子活动。

这是按月计算的

天文学家发现的太阳黑子。

所以我们确实看到了

11年或22年的周期,

里面有很多噪音,

季节性之类的东西。

所以建造它很有趣

保护太阳黑子活动的物质。

事实上,太阳黑子的活动对NASA和

其他太空机构因为

它影响了卫星的运行。

在这门课上,

你将从学习序列模型开始,

时间序列数据,

首先,实践这些技能和建设

这些人造数据模型,

在这门课的最后,

你要把所有这些想法应用到实践中去

塑造太阳黑子活动的令人兴奋的问题。

我们开始吧。

  • Time series examples

你将在哪里学习不同类型的时间序列
更深入地使用时间序列数据。
本周,你将关注时间序列本身。
我们会讲一些例子
不同类型的时间序列,
以及基本的预测。
你也要开始准备了
用于机器学习算法的时间序列数据。
例如,如何分割时间序列数据输入训练,验证和测试集?
我们将探索一些最佳实践
让你为第二周做好准备
你会从哪里开始
使用稠密模型进行预测,以及它的不同之处
更简单的预测对数据进行简单的数值分析。

在第三周,我们将开始使用
递归神经网络预测时间序列。
我们会看到无状态和有状态的方法,
数据窗口培训,你也可以亲自动手预测

最后,在第4周,
您将添加卷积混合,把你做过的所有东西都放进去一起开始预测一些真实世界的数据
这是对太阳黑子活动的测量
在过去的250年里。
我们先来看看时间序列,
它们是什么,还有
你可能会遇到不同的类型。
时间序列无处不在。
你可能在股票价格中看到过,
天气预报、历史趋势、
比如摩尔定律。
这里,我画出了
每平方毫米晶体管数,
我把芯片的发布按年份分组,
然后画出摩尔定律的趋势线
从第一个数据项,
你可以看到相关性。
如果你想要一些有趣的相关性,
这是泰勒·维根网站上的一张照片
虚假的相关性。
这是一个时间序列相关
的总收益
电子游戏街机对
在美国获得计算机科学博士学位。
虽然这些都很熟悉,
他们恳求道,
时间序列到底是什么?
它通常被定义为
通常是等间隔的值

例如,每年
我的摩尔定律图表
每天的天气预报。
在这些例子中,
每一步都有一个值,
结果,单变量项
是用来描述它们的。
你可能还会遇到时间序列
在每个时间步有多个值。
如你所料,
它们被称为多元时间序列。
多元时间序列图可以
了解相关数据影响的有用方法

举个例子,看看这张出生率和
1950年至2008年日本的死亡人数。
它清楚地显示了两者的收敛,
但随后死亡人数开始超过
出生率导致人口下降。
现在,虽然他们可以被视为
两个单独的单变量时间序列,
数据的真正价值变成了
当我们把它们作为多元变量一起展示时,就很明显了。
还要考虑这张图表
全球温度对二氧化碳浓度的影响。
作为单变量,它们会显示
这是一种趋势,但是结合起来,
这种相关性很容易得到
参见向数据添加更多的值。
一个物体的运动也可以画成一个系列
单变量或多变量的组合。
例如,考虑汽车行驶的路径。

时间步长为0
特定的经纬度。
作为后续的时间步长,
这些值根据汽车的路径改变。
汽车的加速度,换句话说,
它的速度不是恒定的,
表示中间的空格
时间步长也会改变,
在这种情况下会变大。
但如果我们要绘图
汽车的方向是单变量的。
根据它的航向,我们可以看出来
车的经度随着时间的推移而减小,
但是它的纬度在增加,
你们会得到这样的图表。

http://img.mukewang.com/5e36e2de00012ca407400382.jpg

  • Machine learning applied to time series

这些只是其中的一些例子
使用时间序列分析。
任何有时间因素的东西都可以用这种方法分析。
那么我们可以用机器学习来做什么呢?
第一个也是最明显的预测是基于数据的预测。
比如出生率和死亡率的图表
我们之前展示过的日本。
预测未来的价值是非常有用的,这样政府机构就可以
为退休、移民和这些趋势的其他社会影响制定计划

在某些情况下,您可能还希望回到过去
看看我们是如何走到今天这一步的。
这个过程叫做归责
(This process is called imputation)。
现在你可能想知道如果你是。数据会是怎样的
能够在您已经拥有的数据之前收集它。
或者您可能只是想填补数据中的漏洞
哪些数据还不存在。
例如,在我们之前的摩尔定律图中。
有几年没有数据,因为没有芯片发布
年,你可以看到这里的差距。
但是如果加上归罪(imputation),我们就能把它们填满。
此外,时间序列预测可以用来检测异常。
例如,在网站日志中,你可以看到潜在的否认
服务攻击在时间序列上以这样的峰值出现。
另一种选择是分析时间序列,找出其中的模式
这决定了是什么产生了这个系列。

一个典型的例子就是通过分析声波来识别其中的单词
它可以作为语音识别的神经网络。
举个例子,你可以看到声波是如何分解成单词的。
利用机器学习,训练神经网络成为可能
根据时间序列来识别单词或子单词。

  • Common patterns in time series
    第一个是趋势,时间序列中它们移动的特定方向。
    另一个概念是季节性,什么时候出现模式以可预测的时间间隔重复。
    也有一些是可能根本无法预测只是一组完整的随机值产生所谓的白噪声。你能做的不多处理这种类型的数据。
    然后考虑这个时间序列。没有趋势,也没有季节性。尖峰出现在随机的时间戳。你无法预测什么时候会发生
    接下来会发生什么,或者他们会有多强大。但显然,整个系列并不是随机的。
    在尖峰之间有一种非常确定的衰变类型。我们可以看到每个时间步的值是99%的价值之前的时间步加一个偶然的尖峰。这是一个自动相关的时间序列。即它与自身的延迟副本通常称为延迟。这个例子可以看到滞后一是有很强的自相关性。通常这样的时间序列被描述为作为步骤的内存依赖于前面的步骤。尖峰是不可预测的通常被称为创新。换句话说,他们不可能基于过去值的预测。
    另一个例子是有多种自相关,在这种情况下,在时间步骤1和50。滞后一个自相关给出这些非常快的短期指数延迟,50表示每次峰值后的结余。你可能会在现实生活中遇到时间序列每个特征都有一点:趋势,季节性,自相关和噪音。就像我们学过的机器学习模型一样是用来识别图案的,
    当我们发现模式时,我们可以做出预测。在大多数情况下,这也是可行的时间序列除了不可预测的噪声。
    但我们应该认识到这一点
    假设存在的模式
    过去当然会延续到未来。

    当然,是真实的时间序列
    并不总是那么简单。
    随着时间的推移,他们的行为会发生巨大的变化。
    例如,这个时间序列
    积极的趋势和
    一个明确的季节性到时间步200。
    但是后来发生了一件事
    完全改变它的行为。
    如果这是股票,那么价格
    也许是一场大的金融危机
    大丑闻或
    或许是颠覆性的技术突破
    造成了巨大的变化。
    从那以后,时间序列开始趋向
    没有明显的季节性。
    我们通常称它为非平稳时间序列
    我们可以预测
    只训练有限的时间。
    例如,这里我只采取最后100步。
    你可能会得到更好的性能
    如果你训练了整个时间序列。
    但这打破了传统机器的模式,
    我们总是假设数据越多越好。
    但对于时间序列预测来说
    这取决于时间序列。
    如果它是静止的
    它的行为不会随着时间而改变,那就很好。
    数据越多越好。
    但如果它不是静止的
    那么你的最佳时间窗口
    应用于培训将有所不同。

    理想情况下,我们愿意
    能够得到整个级数
    计入并产生
    预测接下来会发生什么。
    正如您所看到的,这并不总是那么简单
    考虑到我们在这里看到的巨大变化。
    这就是你要做的

点击查看更多内容
这篇关于时间序列数据简介的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!