随着企业在预测分析和数据驱动决策方面的进步,模拟模型开始出现新的用例。
大多数数据分析技术都源于赌博游戏。例如,玩家可能想确定用三个六面骰子掷出总共14个的可能性(这是二项分布或正态分布的基础)或者了解轮盘赌或扑克的赔率。此类游戏本质上是模拟,数据分析师的目标是创建一个简化的模型来确定复杂系统的行为。
这些模拟已成为唯一可行方法,以解决生物学、物理学、经济学和其他领域中复杂现实世界问题,这些领域具有很多相互作用成分。数据分析专业人士应该了解这四种类型的模拟模型:
- 蒙特卡洛方法。
- 基于代理的建模。
- 离散事件模拟。
- 系统动态建模。
这四种模拟模型是很多游戏、视觉和音频合成技术、机器学习算法、处理内核和控制器系统的基础。在企业做出决定或设计之前,模拟可以虚拟地测试系统。
蒙特卡洛方法
在很多模拟中,很难确定所选变量和这些变量的数据分布是否代表相关模型。蒙特卡洛这个名字来自轮盘赌,这是在蒙特卡洛赌城闻名的博彩游戏。轮盘赌轮有37个编号为0到36的插槽,有18个红色插槽,18个黑色插槽和一个绿色插槽。玩家有48.65%的机会获得红色与黑色插槽,2.7%的机会获得绿色插槽(零)。这三个机会代表一个分布。
任何单个自旋都会产生一个随机值。重复相同的过程1000次或更多,结果的分布应该遵循这些百分比。如果没有遵循这些百分比,可能是其他变量在起作用。
蒙特卡洛方法最古老的已知例子之一是用于计算π值。这可能需要数百万个数据点才能到达那里,这表明了蒙特卡洛模拟的局限性:它们通常没有那么高效。
这种模拟通常与贝叶斯分析一起使用,贝叶斯分析依赖于先前的发现来确定事件发生的可能性。政治分析师经常使用这种技术,民意调查生成一组变量,然后可以汇总创建模型,蒙特卡洛方法用于测试模型。例如,天气事件的集合建模也使用蒙特卡洛来确定飓风的可能路径。
基于代理的建模
任何看到过一群鸟起飞的人都会看到看似随机的初始行为让位于同步活动,即使没有鸟控制它们的活动,鸟类也以不同的队形飞行。飞行中的鸟类制定了简单的规则,根据它们周围看到的东西来告诉它们该怎么做。每只鸟在飞行时都会避开障碍物,并根据周围鸟类的位置实时调整其位置。把这些鸟当成代理人,它们的动作是紧急行为。这些行为是针对基于其他代理行为的一组离散规则的反应。识别这些规则的过程被称为基于代理的建模。
代理系统在20世纪60年代被研究为控制论的最早例子之一,并且仍然很重要。例如,使用计算机模拟典型的繁忙高速公路上的交通可能很困难。相反,很多建模者将每辆汽车模拟为代理,该代理通常遵循一套规则,但还会有定期暂时性行为,以查看汽车总体上的行为方式。
代理系统也用于物联网设备和无人机。这些设备不依赖于通过中央处理器协调活动,中央处理器通过复杂的处理产生延迟和瓶颈。相反,它们对最近的邻居做出反应。只有当它们获得模棱两可的信息时,它们才会与中央控制器交互,或者如果它们无法与邻居或中央控制器互动,则将自己置于安全模式。
这个互动场景是代理系统的缺点。少数代理人之间的中断或类似干扰可能会迅速蔓延。这种现象可能导致难以恢复的重大中断,因为一切都下线的原因是自主发电站的紧急行为。在重启过程中,导致中断的问题可能会在没有说明其原因的情况下得到解决。
代理系统可以模拟,软件对象取代了硬件对象。例如,细胞生物学非常适合基于药剂的建模,因为细胞行为往往会影响附近不同类型的细胞。
离散事件模拟
与代理系统相关的是细胞自动机的概念,这个概念源自约翰·霍顿·康威在20世纪70年代的《生命游戏》中以及后来的斯蒂芬·沃尔夫勒姆的《数学》中。这两种技术都支持图像处理和机器学习中使用的转换滤波器和内核。
此类系统是离散事件模拟的例子。在这些模拟中,时间被分成不同的步骤或块,而不是连续的,每个步骤的模型状态,然后是前一步的模型函数。
在这些模拟中,稳定或准稳定的组件在没有显式编程的情况下出现。
数据分析师在距离决定网格状态或空间的区域使用离散事件模拟。使用基于网格的模型时,用于描述地图的网格越细,结果就越准确。需要对模型进行更正,以解释网格的形状(或拓扑结构)。三角形或六边形网格比矩形网格更准确。
系统动态建模
在一个理想的数学世界中,应该可以用独立函数来描述世界,这意味着它们可以被视为线性函数。实际上,大多数描述系统的变量都是相互耦合的——改变一个变量的值可能会因为它们的相互作用而改变另一个变量。这些是从微分方程中得出的非线性系统。
通过计算,我们可以使用差分方程以数值方式求解此类方程。差分方程使用离散数学来找到特定的解,然后通过构建解来广义。
这种系统的一个很好的例子是捕食者–猎物模拟。在最简单的情况下,有猎物,猎物动物的数量会增加,直到它们的食物用完。那时,猎物数量下降到其食物供应可以恢复的水平。然而,如果在其中加入一个捕食者,事情就会变得更加复杂。猎物现在与两个变量相结合:其食物供应和将杀死猎物动物的捕食者数量。所有三个物种的种群都变得非线性,有些不可预测,甚至混乱。这些方程被称为利亚普诺夫方程,也可用于分析流体和气流动力学方程等系统的稳定性。
系统动态建模(SDM)研究混沌系统。它依靠离散事件模拟和数值方法来确定系统中组件的行为。除了利亚普诺夫解决方案外,SDM还用于高密度粒子模拟——例如,根据作用在理想化版本的恒星上的力对星系的行为进行建模。混沌系统产生了分形,分形是分数维度,通常与迭代、递归结构和新兴行为相关联。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
作者
翻译
相关推荐
-
微软新数据库、分析工具瞄准代理AI
微软推出很多新的数据库和分析功能,旨在支持代理AI开发和分析,包括Fabric中的NoSQL数据库和Power […]
-
Yellowfin推出新NLQ功能,加入GenAI竞争
在4月24日,Yellowfin公司推出了AI NLQ,这是一个由AI驱动的生成式自然语言查询工具,它允许用户 […]
-
Tableau推出Next 进入代理AI时代
在4月15日,Tableau推出Tableau Next,这标志着AI版的Tableau已经到来。 去年9月, […]
-
数据产品的重要性
如果企业将数据视为产品,而不仅仅是业务运营的副产品,企业将可以创造巨大的价值。数据产品可将原始数据转化为影响组 […]