精品课|郑宇:深度学习在时空数据中的应用(视频+PPT)
单击上面的“中国计算机协会”以轻松订阅!
4月8日,在CCF ADL第78届研讨会上,“深度学习:从算法到应用程序”,Zheng Yu博士提供了一份题为“深度学习在空间时间数据中的应用”的报告。本报告探讨了时空的数据特征,以及深度学习技术在时空大数据上的使用和设计方法,基于深度学习分享城市交通预测的实用案例,并介绍深度学习和深度学习的应用学习。以下是Zheng Yu博士报告的PPT和一些视频。
Zheng Yu博士是CCF的杰出成员,CCCF的编辑委员会成员和CCF ADL工作组的负责人。 Microsoft研究所高级研究员,“城市计算”领域的负责权威国际人工智能杂志(SCI District 1杂志)ACM TIST的主编发表了100多篇在国际顶级会议和期刊上(包括50多篇作为主要作者的论文),并引用了该论文Google Scholar H-Index 53(截至2017-5-5)超过12,800次开yunapp体育官网入口下载手机版,该论文在2016年的一年中被引用了3,400次以上。他主持了多个城市大数据系统的发展,其中包括Urban Air首次使用大数据来监视和预测细粒度的空气质量。该服务涵盖了中国的300多个城市,并由中国环境保护部采用。他主持了城市大数据平台的设计和实施,并在中国的大数据演示基础上成功部署了它。 2013年,他被麻省理工学院技术评论(MIT Technology Review)评为“全球杰出的年轻创新者”(TR35),并在《美国时代》杂志上出现在《现代创新者》中。 2014年,由于业务前景巨大和有可能改变行业格局的潜力,《财富》被选为美国40岁以下的40名商业精英之一。 2016年开元ky888棋牌官方版,他被评为美国计算机协会的杰出科学家。
(该视频是Zheng Yu博士报告的上半年。对于CCF成员,请单击[阅读原始文本]以观看所有视频。非会员可以访问Mooc.ai并搜索“ CCF ADL”以进行付费查看)

每个人都听到了许多有关人工智能的报告,其中大多数是视频,语音和自然语言处理中的应用,但是几乎没有什么可以说人工智能在城市和时空大数据中发挥作用。今天,我将讨论深度学习在时空数据中的应用,以便我们的生活变得越来越好。
今天的报告首先介绍了什么是时空数据,时空数据的特征,以及为什么时空数据和深度学习是一种良好的组合,以及在合并时会遇到什么困难。同时,该报告将讨论两个申请。一方面,深度学习用于预测城市大数据中不同地区的流量和转移人员。另一方面,它使用Alphago的原则来引入深度强化学习。最后,我们将在物流中揭示深入的强化学习的一些应用。
什么是时空数据
从交通流量到气象信息,从地理信息到手机信号,都有越来越多的城市数据,都是时间和空间数据。

时空数据的特征
根据数据结构,城市数据可以分为两类:
所谓的时空必须具有时间和空间的属性。根据与数据关联的时空属性的更改和不变,可以将数据分为三个垂直列:下图
点数据:
无法改变时间和空间属性的点数据,例如购物中心,学校,车站等。一旦建造了购物中心,其位置,区域,窗户大小和其他属性就不会随着时间而变化。
该空间保持不变,时间属性随时间变化而变化。例如,在将传感器部署到某个位置后,坐标不会改变,并且传感器每小时的读数随时间变化,例如温度和空气质量随时间变化。
空间和时间坐标将随着时间而变化。例如,Mobike和Didi出租车,发送的请求信号是一条更改时间和空间的消息。
网络数据:
网络数据的时间和空间属性不会改变,例如城市的道路结构,道路网络是静态网络结构。建立网络后,其属性将不会随时间和空间而变化。
该空间保持不变,时间属性随时间的变化而变化。在将交通流叠加在道路网络上后,它变成了一个不变的空间,其属性是随着时间的流逝不断变化的信息。
空间和时间坐标的网络数据会随着时间而变化,即轨迹,骑自行车的轨迹,出租车驾驶的轨迹,迁徙鸟类飞行的轨迹,飞行轨迹,移动电话移动信号等都是轨迹数据。时间和空间随着时间而变化。
生活中的许多数据无非是这六种类型,最复杂的数据是轨迹数据。

以下是关于采矿轨迹数据,包括轨迹数据的预处理,索引和提取,模式匹配,异常检测和分类聚类。只要您掌握了轨迹数据处理的问题,您就可以使用带有轨迹数据处理的轨迹数据处理其他几个数据。 。

在谈论时空数据分类之后,让我们看一下时空数据与其他文本和图像数据之间的差异。
空间差异:
层次结构和距离是空间数据的独特属性之一。

有3个属性在时间方面
时间的三个特征,尤其是周期性和趋势,在视频和声音中也很微不足道,甚至没有。

为什么时空数据可以与深度学习充分结合
深度学习可以为时空数据带来什么?
什么可以使时空数据引起深度学习

让我们看看一个简单的例子,即深圳的出租车轨迹数据

具体而言,我们可以使用卷积神经网络来模拟区域之间的相关性。

进一步寻找,如果有多个城市数据

融合不同的数据并最终执行任务比使用单个数据更好。这就是强调融合的原因。

让我们看看时间和空间数据的数据量的大小。例如,深圳的出租车,公共汽车和卡车的数据刚才。假设将一个框架用作图像数据,则只有一个城市有一年的数据。 ,一个城市的3个数据是9TB,而120个城市为1pb。这些数据比图像数据大得多。这些只是三个小数据。通常,我们使用七个或八种数据,并且数据量令人惊讶,因此深度学习具有合适的位置。

结合深度学习和时空数据的困难是什么

让我们看看下面的特定应用程序。我们希望预测将来,将来有多少人进入并退出一个城市的每个平方公里,即人的流动。
例如,在上海外滩的踩踏事件中,过多的人涌入已导致严重的公共安全事故。如果您事先知道将来有多少人进入和退出以及何时达到峰值,那么政府可以提前实施流量限制,交通限制和控制。例如,北京可以使用此方法来预测未来进入和离开每个地铁的人数。这与地铁容量和调度问题有关,也与安全有关。

该应用程序已应用于Guiyang。
使用出租车轨迹将城市分为一公里的网格,预测每个网格内部进入和退出多少出租车,并使用此数据来验证模型的有效性。该型号是通用的,可以用手机信号,小型数据,迪迪出租车数据,ele.me数据等代替,以预测有多少人进入和离开手机,有多少人骑车和返回自行车,还有多少出租车,有多少人订购食物等。这种模型不仅可以用于城市安全,而且可以用于物流行业。

人们流动预测与许多因素有关,非常困难。预测流量的困难主要在以下方面:

让我们看看下面的特定操作
首先将城市划分为一公里的网格,乘以一公里,然后将过去一个小时内接收到的汽车的轨迹信息投射到该区域,然后计算有多少人进入和退出每个网格,以便每个网格都在那里是二进制文件,即进入和退出的人数,就像每张图片中的每个像素一样,都有RGB 3元素。如果有多个小时的数据,它将成为一个时间序列,类似于下图中的视频流,以及构成输入数据的相应时间时的天气等元素。这是数据转换的问题。数据传输使问题更简单,适合深度学习输入模型,并保留时空信息。

如何使用这些数据进行深度学习
首先,将最后几个帧的数据放入时空残差网络的模型中,将最新时间的数据输入右侧的模型,并在相邻的时间间隔中模拟交通流的变化。这是一个温和的过程;昨天和前一天的相应时间将数据放在中间模型中以模拟周期性。在左模型中放置了一个星期或一个月到期的数据以模拟趋势;这三个模型都是残留网络结构,然后融合。
这三个网络的输出结果并不重要,并且根据特定的应用焦点而有所不同。另外,必须将其与外部因素集成。天气和事件等因素可能具有更大的影响力,这是全球性的。

以上是捕获时间,接近性,周期性和趋势的三个维度。因此,如何捕获空间。
卷积操作使您可以捕获空间的相关性,并且一个卷积可以捕获您附近地区与地区流产之间的相关性。但是,堕胎不仅受周边地区的影响,而且还受到遥远的地方的影响。因此,需要多层卷积才能从更远的地方注入信息。但是,当水平更深时,训练困难将发生,并且会发生梯度下降。问题。因此,这里引入了深层剩余网络,以解决此问题。

RNN/LSTM为什么无法解此问题?例如,如果您使用LSTM,则该模型将变得非常复杂且难以训练。此外,LSTM不考虑空间相关性,并且CNN无法长时间掌握空间相关性。

Wavenet在语音序列中取得了良好的结果,但失去了空间属性。如果将WaveNet和CNN方法与模拟时空数据相结合,则也是一个想法,如果您有兴趣,可以尝试一下。

回到前面提到的模型,这是一个集成的预测。一帧预测,将来将有多少人进入和退出所有网格,从而掌握时间和空间的特征开元ky888棋牌官网版,并掌握外部影响。

时间接近,周期性和趋势的可视化
从下图可以看出,
上述可视化结果告诉您,融合的权重不同。

以下是这些方法比较的结果。在两个数据上行链路,北京的出租车和纽约共享的自行车数据上验证了三个时间特征和外部因素的比较。

上述预测几乎是关于有多少人进入这个地方,有多少人出来。我不知道这些人来自哪里,将来他们会去哪里。如果您想进一步预测这些人的来历以及他们将去哪里,则可以提前安排人们的流动。也就是说,在下面的图中,人们在网格和网格之前的转移。

时空网络和其他网络有什么区别?
一个简单而静态的时空网络是道路网络。每个点都是固定的。
网络结构可以更改,例如传感器网络,节点保持不变,边缘会更改。在战场上的车辆互联网和士兵和坦克网络中,节点正在发生变化,节点之间的通信也在发生变化。

如果您可以预测网络之间的传输,那么许多事情都可以解决,但是这个问题很困难并且具有更高的复杂性。预测网格之间的转移很复杂,数据非常稀疏。

让我们看一下如何使用时空网络解决数据传输预测的问题。

对传入和外向区域进行预测,并同时在区域之间转移预测。这两个互相帮助。这是多任务的想法,同时执行这两个任务。因此,神经网络和深度学习不能直达相同的道路,应与传统的机器学习方法结合使用。

同时,与使用单个方法相比,在几个数据方面的传入,传出和传输的预测更好。

深度学习在人们流动中的预测中有广泛的应用。让我们看一下它在Alphago领域带来的应用程序和灵感。

GO也是一种时间和空间数据。每个磁盘具有19*19个节点,节点是坐标,每个磁盘是时区中的框架。

GO的规则:GO是19*19的棋盘。黑白游戏象棋彼此对抗,获胜者由周围的面积决定。
有几个重要概念:

GO的困难:
Alphago突破了这两个点。

搜索的常见方法:蒙特卡洛树搜索

Aiphago的核心思想包括三个部分:深度学习 +增强的学习 +蒙特卡洛树搜索

在一张图片中了解Aiphago的原理:

以下描述了神经网络中的一些进步,这是算法进步。深度学习与深度神经网络之间的关系。




深度学习将来会有巨大的突破?这是物流。无论您如何做某些方面,都无法超越人。例如,自然语言只能无限地触及人们,而不是人。物流可以超越人们并有很大的需求。不仅jd.com,sf express,而且还依赖于物流计划。任何人做得好的人都可以在行业中具有巨大的优势。
总结:

谢谢大家!

此问题的ADL扬声器视频已上传到CCF官方网站。 CCF成员可以在登录后免费观看。非CCF成员可以访问MOOC.AI搜索“ CCF ADL”并付费观看。
附件:CCF ADL事件预览
CCFADL79“内存设备和系统边界”
主题:内存设备和系统边界
时间和地点:北京,2017年6月14日至16日
学术主任:夏尤·夏乌斯大学,华盛大学科学技术大学
特别发言人:Qian Xue Hainan加利福尼亚大学
演讲的标题:以内存为中心的架构加速神经网络和图形处理
特别发言人:华盛瓦斯港科学技术大学
语音标题:有效检索的智能存储系统
特别发言人:香港中国大学李贝奎明
关于大型SSD存储系统的性能和可靠性
特别发言人:杨金大学罗德岛大学
语音标题:介绍DPU-数据存储处理单元 - 在存储中置换智能
特别发言人:加利福尼亚大学圣塔芭芭拉分校的Xie Yuan
语音主题:以内存为中心的体系结构来缩小计算与内存/存储之间的差距
特别演讲者:江口迪州大学阿灵顿
谈话:大数据时代的数据减少:挑战和机遇
特别发言人:佛罗里达州李陶大学
语音标题:在新技术和新兴应用的大数据时代建立新的非易失性存储系统
特别演讲者:陈海博(Chen Haibo)上海jiaotong大学
可扩展内存计算:系统软件的视角
特别演讲者:Shu Jiwu Tsinghua大学
语音标题:基于非挥发性内存的存储系统的软件层优化
注册QR码:
