数据分析的前景十篇

发布时间:2024-04-29 05:43:11

数据分析的前景篇1

关键词:大数据教育系统应用前景

中图分类号:G64文献标识码:a文章编号:1003-9082(2016)01-0089-01

大数据是信息技术快速发展的产物,其对教育系统能够产生深远的影响。以数据的形式呈现教育给教育领域带来了一次革新。在大数据模式之下,可以分析学生学习行为和变化的内在联系性,可以有效的挖掘教育领域更加深层次的问题。进入新世纪第一个十年间,大数据这个名词的出现为教育领域带来了全新的模式和挑战。学校在办学过程中,拥有了越来越多真实的、有用的、有价值的海量数据信息。这些强大的数据资源可以为教育发展提供强有力的智力支持和数据分析,在教育系统中大数据的应用具有强大的教育工具价值和时代意义。而积极探索将大数据如何应用到教育系统中,是需要我们重点思考的一个问题。

一、国外教育系统应用大数据的现状分析

大数据应用到教育系统中,能够对学生从小学到大学各个时期的学习行为、考试成绩以及职业规划进行详细的关联分析和研究。在国外很多这样的数据信息已经被国外政府机构完好的保存起来,用于今后的统计和分析。现阶段,大数据分析已经被应用到发达国家像美国、日本等国家的公共教育系统中,其成为了促进本国教育系统改革的重要信息基础。为了顺应时展的步伐,美国政府部门在2012年投入一项花费2亿美元的公共教育大数据计划,通过这个项目美国政府希望能够对美国的教育体系进行完善和改革。进入新世纪以后,在美国的教育系统中,逐渐兴起了一股在线教育的潮流,通过这种教育哈弗和麻省理工大学可以收集大量的数据,从而更好的研究世界各地各个国家的教学模式和学习行为,从而打造出适合不同国家学生学习的在线教育平台。通过记录学习者鼠标的点击数量,可以对学习者的学习行为和学习轨迹进行研究,发现不同类型的学习者对不同知识点的反应情况,用多少时间去学习,哪些知识点需要重复讲解或者强调,哪些学习工具和学习方式能够提高学生的学习效率。在追踪个人学习数据时,虽然是杂乱无序的,但是当很多人的数据收集到一定程度之后,群体行为就会在数据中呈现出一种规律,通过分析这些数据的内在联系性,在未来在线教育平台建设过程中才能弥补没有教师面对面交流指导存在的不足,提高知识传播的针对性,比如知识对受教者的投放强度、进度、反馈等。

二、大数据在教育领域应用的前景分析

1.利用大数据研究学生行为和变化内在的联系性

通过目前各类已广泛使用的教育信息系统途径,学生的行为会被各种数据所自动保留,例如学生在学校的时间、按时上课的情况、课堂听讲是否积极主动。在应用过程中以互联网技术和云计算等综合技术为基础,在对学生管理过程中,从数据库中寻找有价值的数据信息,经过全过程性和综合性分析,找到学生与知识之间存在的内在联系性,分析背后隐藏的逻辑关系,并做出合适的教学决策。在学校中积极应用计算机技术和智能通信设备保障了学生和家庭、学生和教师、学生和社会之间的沟通和交流。在大数据背景下,学生在学校的各种表现都可以用数据形式真真切切的反应出来。其能够表现当下学生的行为表现。一方面,可以通过学生之间的行为变化发现内在的联系性。一方面,大数据时代可以显示学生的历史行为,各种数据表单都能够记录下来。通过这些数据我们可以发现学生的学习兴趣,特长爱好等因素。另一方面,大数据可以通过云计算反应学生的变化趋势。学生的变化通常情况下都是不是很明显,只有当学生出现问题之后,才能发现,而数据从开始到结束是有时间差的,这样就可以通过数据提早发现学生的变化,避免产生不良的结果。

2.利用大数据挖掘学生内在特征

传统教学模式通常都以学生的考试成绩判断学生是否优秀,忽视了学生自主发展的空间。例如两个学生在物理考试中都取得了90分的成绩,从表面上看两个学生的分数是一样的,但是通过大数据分析可以发现,一个学生在学习过程中主要依靠的是思维能力,而另一个学生主要靠死记硬背取得高分,结果相同,但是过程明显不同,在未来这两个的人个各自的发展也不尽相同,其中以逻辑思维能力学习的学生,在今后的学习中能够更加顺畅,发展更加长远。而凭借记忆取得好成绩的学生思维能力不足,对今后的学习十分不利。相同的结果不一定具备相同的知识结构,成绩会掩盖一些不足的地方,会影响学生全面发展,而大数据能够反映学生阶段性的自我认知,对个人成长具有指导性作用,帮助学生弥补能力方面的不足,能够更加全面的反应学生在发展过程中存在的问题和风险。

3.利用大数学实现个性化教学

随着智能互联网时代的广泛普及,我们生产生活中传统基础业务系统和当前新起的物联网系统之间异构互联,产生的交互数据高效率地渗透到社会各类行业领域,为我们记录个人行为数据提供了便利的载体。更为重要的是,在这些强大数据收集终端面前,人们没有掩饰的意图,从而收集着过去无法收集及没有梳理的数据,这些海量数据让社会科学从宏观向着微观转变,让跟踪每一个人的数据都成为可能。将这些海量数据应用到教学中,实现对学生的个性化教学。在实际教学过程中,为学生提供一个个性化的教学环境是新课程改革的要求,在大数据的帮助之下,个性化的教育方式正在逐渐成为可能。大数据时代,个性化已经为教育领域提供了现实的路径,通过网络数据分析学生的兴趣、爱好、行为习惯和行为表现,然后对这些数据进行个性化判断,最终实现个性化的教育模式。在中国,个性化教学教师就是通过掌握学生的学习过程的各种数据,进行重点把握,了解学生的学习基础,从而分析学生对知识的掌握程度,避免学习过程重点的重复,以便为学生进行准确的定位。

参考文献

数据分析的前景篇2

“数字地球”是空间信息技术发展中的重要概念。“数字地球”的构想是美国副总统戈尔于1998年提出的,其实质是网络基础设施、数据库与计算机构成的数字化地理虚拟系统,目的是使人们能够通过数字化信息网络,自由地链接、调用地理信息。“数字地球”的核心是3S集成技术。3S包括GpS、RS和GiS。GpS即全球定位系统,可通过坐标系统进行全天候精确定位、定性和定时,在导航、测绘、军事、农业、考古等方面的应用前景广阔。RS即遥感技术,各类卫星遥感能够全天候对地表实时监测,深入、准确地监测地表景观的状态。GiS即地理信息系统,是各类空间数据与属性数据的集成数据库平台,能够进行各类空间分析、演变分析与三维成像。GiS、RS与GpS所采用的数据格式具有共通性,能够达到无缝连接,极大地拓展了风景园林中分析、规划与设计的一体化能力。

二、空间信息技术促进风景园林专业技能变革

空间信息技术的发展能够大幅促进我国风景园林专业技能的变革。主要的变化包括空间数据、景观的监测与分析、工作效率化方面。风景园林研究、规划和设计均涉及各类空间数据。对于规划设计人员来说,获取、处理有效的数据是重要的专业技能。针对基础数据内容庞杂、种类繁多且尺度不一的特点,我国已经着手建设地图数据库、测绘档案等数据基础设施。各类商业遥感影像也是重要的数据源,可以根据用户要求有针对性的调取。规划设计人员能够在GiS平台上,对空间数据进行分析,从而准确地掌握基地的地表状况,提高规划设计方案的合理性。风景园林从业人员可以利用遥感技术对地貌景观进行广域、实时、高精度的监测,并通过GiS进行定量化分析;通过RS和GiS技术,规划师可以定量地掌握绿地植被分布状态,在GiS中可以进行时间序列演变分析、土地适宜性评价、热岛分析、空间分析(包括网络分析、可达性分析、叠加分析等)、景观指数分析等,为绿地规划、城乡与区域规划提供基本的依据。引入数字技术能够大幅提高工作效率。空间数字信息技术,尤其是3S集成技术的不断发展与完善,促进了数据与软件的无缝兼容,推动了园林设计的自动化进程。设计自动化包括办公流程自动化、数据采集自动化、输入输出自动化、分析自动化和管理自动化。办公电子设备与软件集成化发展提高了数据传输与处理的效率,国家大力推动的数据标准化与共享化也有力提升了规划设计人员采集、分析和处理数据的能力。

三、高校风景园林专业空间信息技术教学的目的

(一)加强对空间数据的理解

风景园林专业的规划设计课程涉及到空间数据的处理。空间信息技术教学实际上是围绕空间数据的获取、处理、分析而展开的。目前学生普遍缺乏对空间数据的理解,对于空间数据的基本属性、数据的格式与转换、数据的来源缺少科学的认知。空间信息技术教学可以使学生深入掌握各类空间数据的特征、理解数据的含义和表达、了解数据的来源途径和获取方法,熟练运用不同的空间数据格式转换技能,为识别有效数据、处理数据奠定基础。

(二)掌握空间数据的获取能力

空间数据来源广泛、质量混杂,初学者往往难以理清数据的来源渠道。比如有学生在课题中利用遥感图像进行绿化地解析,所采用的数据为网络下载的栅格数据,这类数据失真性较大,并不能用于绿地定量研究。出现这种错误的根本原因在于学生没有了解有效数据的获取途径。教学中应使学生了解国际、国家和省市等相关机构和商业公司的各类空间数据范围及其特性,以及这些数据对于风景园林专业的用途,使学生具有识别有效数据,掌握有效数据获取途径的能力。

(三)掌握基本的空间分析方法

深入、正确的空间分析是获得合理的规划设计方案的前提,也是对规划设计方案进行调整的基础。因此,应使园林专业学生了解、掌握利用GiS软件处理空间数据和进行空间分析的方法。GiS平台中的空间分析模块包括叠加分析、缓冲区分析、可达性分析、距离分析、表面分析、计量统计等功能,可进行时间序列演变与空间格局的量化分析,也可以利用统计结果进行各类景观指数的演算,并制作相应的主题图,作为规划设计的依据。

(四)掌握数据库能力

数据库是对各类工作数据的管理平台。对于景观规划、园林遗产保护、园林植物与应用方向的学生来说,需要收集、管理各类园林资源、植物和地理空间数据。而现实状况中,这些数据往往数量庞大、来源复杂、格式多样,如何管理好这些数据成为影响工作结果的重要因素之一。数据库是解决这个问题的重要方法。空间信息技术教学应使学生获得数据库构建技能,进一步提升其管理数据、使用数据的能力与效率,对其将来的工作具有很好的促进作用。

四、高校风景园林专业空间信息技术课程设置

风景园林专业是应用性较强的专业,与社会实际需求结合紧密。而空间信息技术本身是系统性的科学,因此需要以风景园林专业特点为中心进行知识点提炼,建立有针对性和系统性的教学体系。风景园林专业课程包括理论与设计两大类型,成系列的规划设计课程为教学体系的中心,相关理论知识点是围绕提高学生规划设计能力这个目标来设置的。因此,空间信息技术课程也应以园林规划设计为中心,设置相应的教学内容,通过培养学生空间数据处理技能达到提高规划设计能力的目的。一般来说,高校园林专业所设置的园林规划设计系列课程包括园林设计与园林规划两大内容。园林设计是针对中小尺度的场地,包括庭园设计、专类公园设计、综合公园设计、广场设计、居住区绿地设计、街旁绿地设计、带状公园设计等课程,园林规划是在大尺度的场地上实施的绿地系统规划、风景区规划、度假区景观规划、滨水区景观规划等。设计的尺度越大,与城市、社区以及自然环境的关系越复杂,就越需要学生具备较好的数据收集和处理能力,并能够掌握、应用一定的空间分析方法。笔者认为,针对园林专业课程内容和技能要求,可将空间信息技术教学内容划分为三个模块,每个模块有不同的教学内容与目的,且与相应的园林教学课程相对应。三个模块包括基础模块、数据处理模块和空间分析模块,基础模块是理论教学,数据处理与空间分析模块是实践教学。基础模块以学生认知空间数据为基本目的,主要包括空间数据的格式与分类、空间数据的作用与意义、地理坐标系统与地图学基本知识、3S技术原理、数据库基础、数据基础设施与常用空间数据源等教学内容。数据处理模块与园林设计课程相对应,以学生在设计过程中能够正确获取、处理基地环境数据为目的,教学内容包括Dem高程数据处理、GpS数据获取与转换、CaD文件格式转换、RS地物分析等。空间分析模块与园林规划课程相对应,以学生在规划过程中能够进行科学地空间分析为根本目的,主要教学内容包括叠加分析、缓冲区分析、可达性分析、距离分析等,并使学生能够制作主题图,作为规划的依据。基础模块、数据处理与空间分析三个模块教学内容应依次进行,只有掌握前一个模块内容,方能进行下一个模块的教学。基础模块必须开设独立的课程,数据处理与空间分析模块既可以是独立的课程,也可以作为园林设计课程中的组成单元,或者采用连续性的讲座形式。

五、难点与展望

数据分析的前景篇3

关键词:图像分割夜景图像图割

中图分类号:tp37文献标识码:a文章编号:1674-098X(2015)08(a)-0096-05

图像分割与融合是计算机视觉与图像处理领域的研究热点,特别是面向人像的前景分割,在目标检测、目标识别、图像融合等相关技术中有十分广泛的应用。其关键技术涉及到人体的定位,以及前景和背景的分离等。由于人体图像具有尺度差异大、纹理复杂、姿态变化多等特点,要从复杂背景中分离出人像信息是十分挑战的课题。特别利用家用低成本相机拍摄的夜景图像,因背景光源复杂,且在闪光拍摄的图像中前景边缘与背景信息容易交互干扰,使得现有的算法难以从这里图像中有效地分割人像区域。

目前人像分割方法大致可以分为人工交互分割与全自动分割等两类,其中人工交互分割一般是基于图割(Graphcut,GC)算法[1],通过手工标记的方式,在人像周围指定背景与前景信息,进而通过构建能量图及边切割,实现背景与前景的分离。基于Grabcut方法[2]则是在选定前景框内,通过分析背景区域与前景框内的分布信息,实现前景目标的分割。实验结果表明,基于图割的算法运算速度较快,分割效率较好,特别对复杂的背景边缘有较好的适用性,得到了广泛的关注,目前市场上已有相关的产品[3]。尽管如此,这类方法在分割过程中需要人工干预,而且在夜景人像边缘模糊的情况下分割效果不佳。

前景的自动分割主要包括基于立体视觉[4]、运动信息[5]和背景建模[6-7]的方法。其中基于立体视觉的方法通过分析视差来判别前景区域。这类方法往往对分割目标的视差范围有一定限制,视差太小前景和背景难以分离,视差过大则场景中存在大量遮挡和零匹配现象,导致分割可靠性不足;基于背景建模的目标分割方法需要利用先验信息对背景进行建模,通常是在视频或序列图像的基础上,分析场景的变化信息,以构建背景模型。此外,在图像前景自动分割中,Sun提出了以闪光/非闪光图像为数据源的抠图方法[8-9]。前提是对场景分别进行闪光/非闪光两次拍摄,在闪光灯开启时,由于前景物体较为靠前因此受闪光影响较大,对应图像更加明亮(强度更高);而没有闪光灯时,前背景的亮度区别较小,从而可以通过亮度对比信息提取前景区域。在相关后续工作[10]中,Sun将该方法拓展为Flashcut算法,实现了前景和背景的协同分割。其基本思路是根据闪光与非闪光图像的差异,分析前景与背景的统计模型,最后通过图割方法实现前景信息的分割。Flashcut提出后,得到了广泛的关注,其中文[11]将闪光-非闪光图构建的前景信息推广到图像的显著分析,取得良好的检测效果。

在简单背景下,现有的分割算法对人像交互分割与融合方面已经取得了较好的效果。然而,针对夜景的人像提取效果仍效果不佳,特别是当背景光源信息复杂,以及前景边缘和背景混合的时候,分割算法基本失效。为此,该文在闪光、非闪光图像的基础上,采用了检测+分割的思路,首先根据梯度直方图特征在非闪光夜景图像中检测人像方位;进而根据同步获取的闪光、非闪光图像差异分布,在人像候选区域统计差分直方图,并通过构建代价函数、分割能量图实现人像的分割。

该文余下内容安排如下:第二章介绍梯度直方图的计算方法,以及在夜景人像检测中的应用;第三章详细阐述基于闪光、非闪光图像的夜景人像分割算法流程;第四章通过实验分析本文算法的可靠性;第五章为论文总结。

1基于梯度直方图的夜景人像检测

夜景人像检测的目的是确定分割的候选区域,避免背景复杂光源,以及背景运动目标等因素对分割效果的影响。针对夜景人像的特点,本文采用了基于梯度直方图(HistogramoforientedGradient,HoG)[12]与支撑向量机相结合的检测方法,以实现夜景人像的检测。HoG是目前最为广泛使用的行人特征表示方法之一,其主要思想是通过图像局部区域的梯度特征统计来增强判别性能。HoG特征的具体计算过程如算法1所示,其中行人图片大小为64×128,块(Block)大小为16×16,格子(cell)大小为8×8,每个块内包含4个格子,格子是计算HoG的最基本单元(如表1所示)。

根据文[12]实验设置的推荐,以及夜景图像特点,本文采用以下的设置以提高HoG的判别性能:(1)梯度计算时采用的掩膜为[-101]和[-101]t;(2)投票的时候方向角和空间位置进行线性插值,即三线性插值;(3)块内的每个象素在投票的时候进行高斯加权;(4)对块的特征向量进行归一化处理。

梯度直方图特征具有高维特点,需采用高效的分类器以实现特征的判别。由于支撑向量机(SupportVectormachine,SVm)是建立在统计学习的VC维理论和结构风险最小原理基础上的,它在解决小样本、非线性及高维模式识别中独具优势。为此,本文采用SVm作为夜景人像判别分类器。

2基于闪光图像的夜景人像分割

在人像区域检测基础上,可利用闪光与非闪光图像的对比统计信息,以提高人像分割的效果。为此,本文首先根据二值分类定义了前景分割的能量函数,并针对能量函数中的数据项与平滑项展开分析。特别是数据项的设计,融入了闪光变化特点、颜色信息,以及匹配变换估计信息等。以下将分别介绍能量函数的构造以及数据项的具体计算流程。

2.1总体代价函数

为实现前景与背景的分类,本文定义代价函数如公式1所示:

(1)

其中xp表示像素p的背景标签,即当且仅当p为背景时,xp=1,否则xp=0;ed为数据项,表示像素p分类为xp的代价;es为平滑项,主要用于惩罚相邻像素p,q的分类xp与xq不一致,目的减少噪声干扰,保证分割结果的平滑性;α是权衡数据项与平滑项的权重。当公式1达到最小值时,对应的前景信息为人像分类结果。

为了减少相邻像素的分类差异,定义平滑项es如下:

(2)

其中用于调节相邻点灰度差对分类的影响。

根据夜景人像特点,设计数据项如下:

(3)

其中分别用于衡量前景分类代价、闪光与非闪光图像之间的运动差异,以及颜色信息差异,其计算方法将分别在2.2~2.4中阐述;为的权重。

2.2基于直方图对比的前景分类代价

在公式3中,用于衡量闪光与非闪光图像中,像素直方图的变化情况。主要思路是通过对比分析闪光图像与无闪光图像的直方图信息来进行建模。如果是离摄像头比较远的物体,则受闪光的影响比较小;如果是离摄像头比较近的前景物体,则受闪光的影响比较大。因此通过分析闪光前后,直方图的变化情况,对象素点与前景之间的隶属度进行赋值。假设和分别表示闪光图像和无闪光图像的颜色直方图。若,则说明闪光之后,第k个直方图区间的象数点数目变少,也就是第k个直方图区间的部分象数点被分配到了的其他区间(具体是哪个区间不知道);若,则说明闪光之后,第k个直方图区间的象数点数目变多,说明的其他区间(具体是哪个区间不知道)上的象数点部分被分配到了直方图的第k个区间。综上,可定义代价项如下:

(4)

其中闪光和非闪光图像的rp分别取值为和。

2.3变换补偿

公式3中的et(xp)用于衡量闪光与非闪光图像中,对应同名点之间的像素差异。假设已经知道了闪光前和闪光后两张图像之间的位移信息m(p)。那么对于闪光前的图像而言,如果象数点的亮度信息变大了,那么是前景的概率应该相应增加。闪光前后的亮度信息差异可以用如下公式表示:

(5)

一般认为,背景的像素点亮度变化较小。因此,可以用一个高斯分布来表述亮度差异信息,即,。像素点p属于背景的概率可以用如下公式刻画,

(6)

可以看出,当时,。综上,能量项et(xp)的可定义如下:

(7)

上式中未知的参数是。首先,可通过稀疏特征匹配来计算特征点的亮度差异信息,以差异直方图均值作为μ的初值。则可以在直方图中截取亮度差异小于某个阈值t的所有点统计得到,其中t取值为大于μ的首个局部极小点。由于同步采集的两幅图像之间尺度、角度基本一致,为提高分割效率,本文采用FaSt算子[14]进行特征提取,利用oRB描述子[15]实现稀疏特征匹配,并采用RanSaC算法[16]去除错误匹配特征。

偏移量m的初值可以根据RanSaC获取的变换结构,计算像素稠密匹配来得到。由于两幅图像同步获取,且人像前景景深差异小,因此本文采用透视变换来作为像素位移初值的计算依据。在此基础上,利用光流中改进的Lucas-Kanade算法[17]来迭代计算稠密的像素变换补偿参数,具体如公式8所示:

(8)

2.4基于混合高斯模型的前景分类代价

在公式3中,用于衡量前景信息的概率。在上述求解到的前景和背景概率的基础上,挑选出所有背景概率小于0.4的点,用于构造前景混合高斯分布[13]。具体计算方法如公式9所示:

(9)

其中K是混合高斯模型的模型数量;wk是各个模型的权重;uk,∑k分别表示第k个模型的均值与协方差。同理,计算背景混合高斯分布可以挑选所有背景概率超过0.6的像素,通过文[13]的方法统计得到。在此基础上,前景分类代价可以表示为:

(10)

2.5算法流程

根据2.1~2.3的计算规则,本文总体算法流程如算法2所示(如表2所示)。

3实验结果与分析

实验的目的是测试本文方法对夜景人像分割的效果。为此,本文根据实验需求采集了序列夜景图像集,其中包含背景运动干扰、背景复杂光源(夜景工程)、前景纹理变化(衣着差异)等多个不同类别,部分数据如图1所示。以下将详细描述实验的设置,以及结果分析。

3.1实验设置

在夜景人像检测模块,HoG特征为3780维,梯度计算时采用的掩膜为[-101]和[-101]t;投票采用三线性插值。在代价函数模块,公式1中的权重α取值为30;考虑到夜景图像的闪光与非闪光图像中,像素变化十分强烈,导致部分背景隶属于前景概率也相应提升,因此应适当降低了直方图前景分布代价的权重,公式3中的数据项权重分别为5,15;公式4中的ζ=0.2;在颜色项中,混合高斯模型的数量取值为10。

3.2结果与分析

第一组实验主要评价夜景图像的人像检测效果。由于本文的目标是自动分割出闪光图像的人像,因此只需在闪光图像中检测行人区域。图2中的背景包括复杂光源、运动目标、前景边缘与背景强度差异小等干扰因素。由于夜景人像往往背景强度相对较弱,相比之下,前景的强度、纹理特征丰富。从实验结果可以看出,采用HoG特征可以充分描述人像的表观模型,因此SVm分类器能有效提取图像中的行人区域。

第二组实验主要评价本文的图割算法对于夜景人像的分割效果。针对背景运动、局部遮挡、复杂背景等因素对分割效果的影响,我们分别选取了图3-图6用于分析分割效果。如图3(a)(b)(c)分别为闪光图像、非闪光图像、人像分割结果。从图3(a)和图3(b)中可以看出,背景存在运动目标。由于背景中的人像强度信息(光线)较弱,纹理受噪声干扰明显,因此行人检测器没有响应背景人像。而本文的算法只针对人像区域分析,因此可以有效过滤背景运动对分割效果的影响。在图4中,前景包含了部分背景信息(手臂下方),由于本文通过像素分布设置了背景概率统计信息。因此,在前景背景混合的情况下,构建的能量图能给定前景和背景不同的权重,从而利用图割算法可以有效地分割出人像区域,具体如图4(c)所示。

图5和图6用于评价复杂背景对于人像分割的影响。从图5(a)可以看出,人像上半部分的背景强度信息与人像信息接近,因此该区域的前景概率容易混淆。从实验结果也可以看出,人像下半身的背景区域纹理简单,有较好的分割效果,但是上半部分特别是肩膀附近,存在一定的错分割现象。图6的结果也印证了上述结论,即前景边缘与背景差异很小的时候,构造出的能量图相应的边权值也相应较小,导致分割后的边缘存在锯齿现象。

4结语

目前的夜景人像分割大多是采用交互的方式提取人像外轮廓,在背景光源复杂的情况下需要大量的人工干涉。本文针对夜景人像的自动分割问题,利用同步获取的闪光和非闪光图像之间的差异,分析前景的概率分布信息。基本流程包括利用直方图特征实现人像区域检测、基于闪光图像变化分布和变换补偿的代价函数构造,以及利用图割实现人像提取等。实验结果表明本文的方法有效增强了分割的自动化程度,特别是增加了人像检测后,在背景光源复杂以及背景变化的情况下有较好的分割效果。预计相关成果在夜景图像融合中有一定的推广价值。

参考文献

[1]BoykovYY,Jollymp.interactivegraphcutsforoptimalboundary®ionsegmentationofobjectsinnDimages[C]//ComputerVision,2001.iCCV2001.proceedings.eighthieeeinternationalConferenceon.ieee,2001:105-112.

[2]RotherC,KolmogorovV,Blakea.Grabcut:interactiveforegroundextractionusingiteratedgraphcuts[J].aCmtransactionsonGraphics(toG),2004,23(3):309-314.

[3]沈洋,林晓,谢志峰,等.交互式前景抠图技术综述[J].计算机辅助设计与图形学学报,2014,26(4):511-519.

[4]torrpHS,SzeliskiR,anandanp.anintegratedBayesianapproachtolayerextractionfromimagesequences[J].patternanalysisandmachineintelligence,ieeetransactionson,2001,23(3):297-303.

[5]SunJ,Zhangw,tangX,etal.Backgroundcut[C]//ComputerVisionCeCCV2006.SpringerBerlinHeidelberg,2006:628-641.

[6]mittala,paragiosn.motion-basedbackgroundsubtractionusingadaptivekerneldensityestimation[C]//ComputerVisionandpatternRecognition,2004.CVpR2004.proceedingsofthe2004ieeeComputerSocietyConferenceon.ieee,2004:ii-302-ii-309Vol.2.

[7]monneta,mittala,paragiosn,etal.Backgroundmodelingandsubtractionofdynamicscenes[C]//ComputerVision,2003.proceedings.ninthieeeinternationalConferenceon.ieee,2003:1305-1312.

[8]J.Sun,Y.Li,S.B.Kang,etal.Flashmatting[m].inproceedingsofSiGGRapH,2006:361-366.

[9]SunJ,LiY,KangSB,etal.Flashmatting[J].aCmtransactionsonGraphics(toG),2006,25(3):772-778.

[10]SunJ,KangSB,XuZB,etal.Flashcut:Foregroundextractionwithflashandno-flashimagepairs[C]//ComputerVisionandpatternRecognition,2007.CVpR’07.ieeeConferenceon.ieee,2007:1-8.

[11]HeS,LauRwH.SaliencyDetectionwithFlashandno-flashimagepairs[C]//ComputerVisionCeCCV2014.Springerinternationalpublishing,2014:110-124.

[12]Dalaln,triggsB.Histogramsoforientedgradientsforhumandetection[C]//ComputerVisionandpatternRecognition,2005.CVpR2005.ieeeComputerSocietyConferenceon.ieee,2005:886-893.

[13]Blakea,RotherC,Brownm,etal.interactiveimagesegmentationusinganadaptiveGmmRFmodel[C]//ComputerVisioneCCV2004.SpringerBerlinHeidelberg,2004:428-441.

[14]Rostene,Drummondt.machinelearningforhigh-speedcornerdetection[C]//ComputerVisionCeCCV2006.SpringerBerlinHeidelberg,2006:430-443.

[15]Rubleee,RabaudV,KonoligeK,etal.oRB:anefficientalternativetosiftorsurf[C]//ComputerVision(iCCV),2011ieeeinternationalConferenceon.ieee,2011:2564-2571.

数据分析的前景篇4

关键词:商品市场;合成景气指数;扩散景气指数;转折点

中图分类号:F713

文献标识码:a

文章编号:1003―7217(2008)06―0081―06

一、引言

发达的商品市场是现代市场经济的重要标志之一。随着市场经济的发展,我国商品市场也日益发达,商品市场的景气波动问题也就越来越引起研究者的注意。商品市场景气波动是宏观经济景气波动的一个重要分支,对商品市场景气的分析预测不仅能够帮助我们更好地把握宏观经济景气动向,而且能够促进商品市场的平稳健康发展。因此,对商品市场景气转折点的分析预测具有重要的理论和现实意义。

20世纪80年代中期,景气指数的分析方法开始引入我国。国家信息中心经济预测部、中国社会科学院数量经济与技术经济研究所以及吉林大学等科研机构均对我国宏观经济景气进行过分析和预测。此外,国家统计局中国经济景气监测中心于2006年构建了我国天然气消费行业景气指数体系。商务部市场运行司于2006年构建消费预警系统,并在短期内推出了“消费综合景气指数”研制系统。但是,尽管近些年来对我国宏观经济的分析与预测以及对具体行业景气分析的研究文献不断增多,但对于我国商品市场流通领域的景气分析却严重滞后,到目前为止,还很少有人对我国商品市场进行景气分析和预测。因此,本文旨在对我国商品市场景气进行分析,并以此为基础对我国商品市场的转折点进行预测。

文章的基本思路是:通过构建我国商品市场景气指标体系,建立我国商品市场1999年4月~2008年2月的先行合成指数、一致合成指数、先行扩散指数以及一致扩散指数,并对当前的商品市场形势进行分析,再以此为基础,利用VaR模型对我国商品市场景气指数进行预测,通过预测结果来判断商品市场景气转折点可能出现的时间。

二、当前商品市场景气分析

我们从近60组能够反映商品市场景气波动的月度经济数据中,按照景气指标选取的要求选出了10个经济指标作为我国商品市场景气分析的先行指标以及一致指标,其中先行景气指标有:轻工业增加值、汽车产量、进口总额、金融机构工资性现金支出和微型电子计算机,一致景气指标有工业增加值、流动资产周转率、原材料购进价格指数、全国商品零售价指数以及重工业增加值。作为参照系,本文的基准循环选取的是社会消费品零售总额增长率,这主要是因为零售市场景气波动对我国消费品市场与生产资料市场均能产生重大影响,是商品市场波动的风向标。基准日期则是用工业增加值、工业产品销售率、流动资产周转率、销售成本利润率、原材料购进价格指数、全国居民消费价格指数、全国商品零售价格指数等与商品市场波动基本一致的指标,采用国际通用的HDi方法确定得来(如表1所示)。受统计数据的时间长度限制,仅对1999年以来的商品市场进行分析。

根据《中国人民银行统计季报》(1999~2008年)以及《中国经济景气月报》(1999~2008年)提供的数据,我们采用美国商务部的编制方法,编制了我国商品市场先行合成指数(Y1)、先行扩散指数(Y2)、一致合成指数(Y3)以及一致扩散指数(Y4)。由于篇幅有限,本文将不把已经计算出来的1999年4月~2008年2月的先行、一致扩散指数以及先行、一致合成指数的具体数据列上,有兴趣的读者可以向作者直接索取。先行、一致合成指数与先行、一致扩散指数走势如图1、图2所示。

从表1以及图1、图2上看,我国商品市场在1999年4月~2008年2月一共经历了三次景气波动,目前正处于尚未完成的第三次景气波动中,下面结合图表对我国1999年4月~2008年2月商品市场的景气状态进行分析。

第一轮景气波动:1999年5月~2002年3月。受宏观经济逐步回暖的影响,商品市场从1999年5月开始从上一轮景气波动的波谷中走出,一致扩散指数在1999年12月以后的8个月中均达到100%,说明各个一致景气指数均在上升期间,景气回升势头十分强劲,经过19个月的扩张,这一轮景气波动于2000年11月达到顶峰。其后,受全球经济增长放慢及美国9・11事件的影响,我国商品市场景气开始快速地向下滑落,合成指数图形的走势显示,这一轮下跌幅度较大,先行合成指数从最高位的101.8下跌到了最低的97,一致合成指数也下跌了4个指数点。这一轮景气周期于2002年3月滑落至最低点,历时35个月。

第二轮景气波动:2002年3月~2005年11月。这一轮景气波动的启动得益于我国国内消费需求的启动,在国际需求不旺的情况下,我国长期实施的扩大内需的政策开始显现成效。商品市场景气指数从2002年初的波谷开始回升,走出了一波长达30个月的扩张行情,先行扩散指数与一致扩散指数均在很长时间内处于100%。从合成指数图形上看,这轮景气波动幅度也是比较大的。2004年8月,第二轮景气波动达到波峰,但是此时宏观经济已经出现局部过热现象,而后在国家采取“管住土地,管紧信贷”等一系列紧缩政策的调控下,景气指数在到达顶峰后开始快速回落,2005年11月到达第二轮景气波动的波谷,不过从合成指数上看,这一轮波谷比上一轮的波谷相对要高一些,同时收缩期的时间长度也相对短一些。

第三轮景气波动:2005年11月以来至今尚未完成。第三轮景气波动在复苏期间比起前两轮要缓慢一些,从合成指数看,在到达上一轮景气波动的波谷之后,先行合成指数与一致合成指数均在底部徘徊了几个月的时间,上升的速度比不上前面两轮的强劲,但是在完成底部的盘旋后合成指数上升速度很快,先行合成指数在2006年稍作调整后于2007年9月达到了这一轮波动的波峰,而一致合成指数则是一直向上,到2007年底已经直逼上一轮的高点,该轮高点位置目前还不能判断。扩散指数自2005年年底的上转点起来以后,经历了比较长的扩张期,先行扩散指数在2007年9月出现了该轮景气的下转点,一致扩散指数虽然到2008年2月为止还没有穿越0.5的分界线,但是从走势上看下转点的位置应该也已经不远。这一轮景气波动与前两轮比较起来,虽然波谷徘徊时间较长,但是上升时速度较快。从现有结果来看,根据HDi方法确定的基准日期,2005年11月以来的这一轮景气的转折点还没

有到来,一致扩散指数与一致合成指数也还没有到达波峰,但是先行扩散指数与先行合成指数的转折点已经可以看到,相信这一轮景气的转折点很快就会到来。接下来,将构建VaR模型对商品市场景气指数进行预测,对这一轮景气的转折点进行判断。

三、商品市场景气指数的预测

以前面计算出来的先行合成指数、先行扩散指数、一致合成指数以及一致扩散指数的月度数据为基础,利用计量经济学中常用的VaR模型对我国商品市场2005年末以来的这一轮景气波动的转折点进行预测。

由于扩散景气指数与合成景气指数的编制采用的是同一组经济指标,先行与一致指标的选取也是以同一个基准指标(社会消费品零售总额增长率)为参照指标进行选取的,而且通过GRanGeR因果检验得知先行合成指数(Y1)、先行扩散指数(Y2)、一致合成指数(Y3)以及一致扩散指数(Y4)两两之间都互相存在GRanGeR因果关系,也就是说它们可以互相作为彼此的内生变量对待。因此,当把Y1、Y2、Y2、Y4当成内生变量向量,把截距项C当成外生变量向量时,完全满足VaR模型的条件。首先,采用LR统计量准则对最佳滞后阶数进行判断。依靠eViewS5.0软件,可得VaR模型滞后长度为16时,LR值显著,因此,滞后阶数取16。为简便起见,把依靠eViewS5.0软件估计的VaR模型结果用式(1)来表示,把矩阵a1、a2…a16、C的具体数据略去。

yit=a1yi(t-1)+a2yi(t-2)+…+a16yi(t-16)+C (1)

模型的R2=0.999,这说明回归式拟合得非常好。

其次,通过检验模型的平稳性和模型残差,得知被估计的VaR模型所有单位根的模都小于1,即位于单位圆内,满足模型稳定条件,而且各残差都是白噪声序列,模型检验通过。

最后,用式(1)对原数据进行动态模拟,模拟的结果如图3所示。从动态模拟结果可知,模拟的曲线形状虽然与原曲线不完全重合,但基本趋势是差不多的,而且转折点也基本一致。

综上所述,以上建立的模型不仅拟合度较高并且是经得起实验检验的。根据前两轮景气波动的时间长度,可以判断这一轮景气波动的转折点将在不久的将来出现,因此本文根据式(1)来预测2008年3月~2009年12月的商品市场的先行扩散指数、一致扩散指数、先行合成指数以及一致合成指数,预测的结果如表2所示。

四、景气转折点的预测分析

为了直观地观察商品市场未来的走势,绘制1999年4月~2009年12月的先行合成指数与一致合成指数、先行扩散指数与一致扩散指数的波动图形,见图4与图5。

在前面对于扩散指数与合成指数的分析中,我们判断2008年我国的商品市场的转折点将很快出现,而从VaR模型预测得出的图像上看,这个观点显然得到了证实。

从图4中可以发现,先行合成指数在2007年9月就出现了波峰,一致合成指数滞后先行合成指数6个月,于2008年3月到达波峰,该轮扩张期时间长达两年。其后商品市场合成指数开始向下运行,到2008年10月这一轮的先行合成指数的波谷出现,收缩时间仅为一年零1个月,但是一致合成指数滞后了8个月,到2009年6月一致合成指数的波谷才出现,收缩时间也只有一年零3个月。

从图5看,先行扩散指数也是在2007年9月就到达了景气的下转点,而一致扩散指数则是在2008年3月就穿过了0.5的分界线,滞后先行扩散指数6个月。根据预测结果,2008年10月先行扩散指数就再次出现了景气上转点,收缩时间与先行合成指数一样也只有1年零1个月,而一致扩散指数也在2009年3月出现了景气上转点,滞后5个月,收缩时间仅为一年。

由于扩散指数与合成指数编制的方法的不同,两者测量出来的商品市场景气波动的幅度与转折点的日期也是不同的。需要通过扩散指数与合成指数之间的联系,以及他们与基准日期之间的关系,对接下来的转折点日期进行判断。

首先对基准日期的波峰进行判断。通过比较可以发现,一致扩散指数到达这一轮景气波动的下转点的时间要比一致合成指数到达波峰位置的时间早,大约提前了1个月,但是,对比1999~2008年的扩散指数与合成指数的各个转折点的日期,这种时间上的出人是正常的(见表3)。从表3上可以看出,先行扩散指数与先行合成指数的景气转折点出现的时间差基本上都不超过2个月,而这个转折点出现的时间刚好相同,这个是比较稳定的。一致扩散指数与一致合成指数的景气转折点,除去第三轮的第一个谷位有7个月的时间差外,其他时间差也在3个月以内,而这一轮景气转折点两者的时间差为+1个月,这个也是稳定的。从先行景气指标的先行月份来看,VaR模型预测的转折点时间也是合理的。从几次转折点出现的时间上看,先行合成指数的转折点比一致合成指数的转折点平均领先6个月,此次也是恰好6个月;先行扩散指数的转折点比一致扩散指数的转折点平均领先8个月,此次领先11个月,基本上时间差距也不大。因此,通过预测得到的图形走势是稳定的。由于一致扩散指数与一致合成指数的景气下转点的时间基本上与商品市场基准日期波峰的时间差为+3个月,因此,我国商品市场从2005年11月开始的这一轮景气波动将在2008年6月左右到达波峰。

再对这轮景气波动的谷位进行判断。从预测结果来看,2005年开始的这一轮景气波动,将在2009年走完完整的周期。根据预测结果,先行扩散指数与先行合成指数均在2008年10月就已经出现上转点,这意味着我国商品市场的收缩期即将结束。2009年3月一致扩散指数出现景气上转点,滞后先行扩散指数5个月,这与前面计算的平均滞后时间相比稍微短一些,但出入不大。一致合成指数则是在2009年6月出现波谷,滞后先行合成指数8个月,比平均值6个月稍长。一致合成指数与一致扩散指数出现转折点的时间相差3个月,与前期相比,尚在波动范围之内。总体来说,各指标的预测值与前期各转折点相比还是比较稳定的。由于一致扩散指数与一致合成指数的景气上转点的时间基本上与商品市场基准日期波谷的时间差为+2个月,那么结合合成指数以及扩散指数与基准日期之间的数据关系,可以判断2009年8月左右我国将迎来这一轮景气波动收缩期的终点。

数据分析的前景篇5

关键词:大数据旅游管理应用

旅游业的发展对于国民经济发展有着积极的推动作用,旅游景点的建设带动区域经济发展,带动相关产业链的发展,包括基础设施、住宿、餐饮等产业。近年来,借助互联网,旅游业获得很好的发展。人们利用互联网搜索旅游景点、食宿等信息,也可以利用互联网预订酒店、购买门票等。例如通过携程网、去哪网等,购买机票、火车票、订购酒店等都十分方便,极大地促进了旅游业的发展。

一、旅游大数据

大数据泛指海量的数据。旅游大数据就是旅游业各供应链环境产生的数据的总和,包括旅游的供应商、中介商、旅游者、旅游管理部门等在整个旅游过程和旅游服务产生的数据信息。旅游数据信息有着重要的价值,通过对数据的分析,可以更好地发展旅游业。旅游大数据可以分为结构化和非结构化的数据。结构化的数据也就是数据库,是指那些可以被存储和整理的数据。非结构化的数据是指非数据类型的格式,包括文档、图片、网页、报表、音视频等。

二、大数据在旅游管理中的应用

1.大数据用于旅游者的需求分析

通过旅游大数据的分析,可以实现旅游需求的有效预测,旅游需求预测可以为旅游决策提供参考和依据。一般情况下,旅游需求是政府进行旅游规划的重要依据,通过对旅游需求的预测,可以保证旅游服务各供应链之间实现协同合作。旅游需求的内容包括:硬件需求,也就是对旅游设施的需求,旅游业的开展需要相配套的设施,例如,交通设施、食宿设施以及旅游景区的硬件设施等;软件需求,也就是对旅游服务的需求,包括导游、景区介绍等。由于硬件建设是一个缓慢和持续的过程,也相对稳定,需求的预测比较简单。旅游服务有季节性、不可存储性和无形性的特点,变化比较频繁,如果预测的旅游需求差距较大,则可能带来较大的成本风险。因此,旅游服务才是需求预测的重点内容。对于旅游的供应商或者中介商而言,如果旅游需求预测不准确,会出现准备不足的情况,影响到服务的等待时间以及服务质量,影响游客的体验。如果服务准备过多,则会造成服务的成本增加以及服务资源的浪费。例如,九寨沟景区出现的游客滞留事件以及上海外滩出现的踩踏事件等,都是由需求预测不准确引发的事故,损害到游客和服务供应商双方的利益。旅游需求的分析和预测主要通过统计学的算法实现。现阶段,关于旅游需求的统计学预测模型有定性模型、结构模型、仿真模型、趋势外推模型四种。定性模型主要采用问卷的方式,对未来旅游趋势进行预测;结构模型是通过建立旅游需求同影响需求的变量关系,实现需求的预测;仿真模型是通过结构模型和趋势外推模型组合的预测模型;趋势外推模型使用历史数据进行未来需求的预测。在实际的需求预测中,无论采取何种模型,都需要考虑成本、时间以及其他限制因素的关系,进行综合性的考虑。

2.大数据用于游客市场的细分以及营销

通过对旅游大数据的分析,可以实现对游客市场的细分,进而有针对性地开展旅游营销活动。旅游服务提供者合理地划分游客市场,预测游客需求,更好地提供旅游服务。旅游大数据包括游客的基本属性、旅游偏好、行为特征等众多方面,从多方面分析游客旅游行为,细分游客,进而推测旅游营销的可行性,实现精准营销。游客的基本属性主要指游客的性别、年龄、经济收入、教育程度等情况。行为特征是指游客选择的出游方式(自驾游、旅游团、火车、汽车、飞机等)、旅游的动机(休闲、娱乐、度假等)等。游客偏好主要是指游客的食宿偏好、交通偏好等。对于旅游的供应商和中介商而言,旅游大数据有助于对游客进行有效的识别,挖掘潜在的游客,进而开展旅游营销。旅游过程中,对于出现的客源流失以及满意度不高的情况,可以通过旅游数据进行原因调查,比如采取网络评价、投诉记录、游记等方式,找到旅游景点存在的问题,及时进行补救,寻找和开发旅游兴趣点,提升游客的满意率。因此,利用旅游大数据,对游客的各项基本属性和行为偏好分析,可以实现对全国的市场进行旅游客源的精准定位。同样的,旅游大数据对于游客而言也有着积极作用。通过游客数据的分析,旅游市场进行细分,提供个性化的旅游模式,更好地满足旅游消费者的需求。现阶段,旅游消费可以说逐步向着买方市场过渡,游客的需求成为旅游市场发展的风向标,游客对于旅游的多元化和个性化需求促使旅游模式发展变化。例如,传统的旅游模式主要为观光旅游,也就是游客游览风景,体验当地的风土人情。买方市场下的旅游模式,逐步朝着多元化的方式发展,集休闲、观光、户外健身、度假等为一体。游客还可以通过旅游大数据,了解到旅游景区的情况,包括天气情况、住宿情况、交通情况以及旅游项目等等,并根据其他游客对于旅游景区的评价决定自己的旅游去向。对于旅游的管理机构而言,旅游大数据同样可以促进旅游景区的管理。通过旅游大数据,可以对未来时间内的游客数量以及车流量进行有效的预测,例如,根据景区的售票情况以及酒店的预定情况,预测游客的数量。根据游客的旅游属性,可以进行相应旅游资源和服务的准备工作,保证游客的旅游满意度。通过景区的监控系统,实现对景区人员的实时监控,同时也可以利用监控数据,进行景区资源的合理分配。

3.大数据在旅游规划和宏观调控中的应用

旅游大数据有很好的前瞻性,可以对旅游市场进行剖析以及对旅游需求进行预测。利用大数据,在旅游规划时,可以预测旅游景区运营时的市场规模,为旅游景区的规划提供数据支持。前面已经论述到,大数据时代下,通过旅游大数据的分析,可以对游客的各种属性进行数据分析,包括游客的数量、来源地、年龄、性别、旅游偏好等等内容,进而进行旅游市场的细分,开展精准的旅游营销。这些工作都是旅游规划需要关注的内容。在进行旅游景区规划时,需要对旅游景区进行整体的设计,包括旅游的线路、旅游的交通、旅游的基础设施等,都需要提前做好规划,而规划的依据,便是旅游的大数据。同样的,旅游大数据可以用于旅游的宏观调控。相较于政府利用行政、法律和规划进行旅游市场的调控,信息调控这种方式更加有效。旅游大数据以旅游信息为基础,旅游发展已经开始围绕买方市场进行,收集游客的需求,实现旅游市场的自我调节,减少政府对旅游业的干预。在大数据时代下,政府和旅游企业都应逐步加强对大数据的利用,建立旅游的大数据平台。一方面利用数据为决策提供数据服务,另一方面可以提供一些增值性服务。例如,建立旅游信息的平台,引导游客的旅游方向以及完善旅游的服务内容。以移动互联网为例,手机是重要的通讯工具,可以研发旅游的app,集旅游、交通、住宿、餐饮、娱乐为一体,为游客提供旅游信息,同时宣传旅游的注意事项和安全急救常识等。目前,许多景区也利用互联网络,开展智慧旅游,例如,游客利用手机扫描景区二维码,便可以实现实时的旅游讲解。

4.利用大数据实现旅游信息的共享与协同

利用旅游大数据的方式,可以将众多的旅游信息结合起来,用于旅游需求的分析和预测。大数据的使用,将旅游服务的各环节参与者联系起来,实现旅游数据的共享,也就是旅游供应的信息流、服务流、价值流的统一,实现旅游的协同服务。旅游服务各供应商之间的联系更加密切,一方出现旅游需求,信息及时传递给其他参与方,及时地做出判断。旅游产品作为服务种类的一种,其生产和消费是同时发生的,游客只能在景区内获得旅游体验,而不能在购买之前体验旅游产品,因此,游客对于旅游产品都有着一定的预期。这种预期会影响着游客的旅游需求。例如,游客在选择景区之前,利用其他游客分享的旅游评论,进行旅游景区的选择。

参考文献:

[1]刘志霞.大数据在旅游管理中的应用探讨研究[J].广东技术师范学院学报,2016(4).

[2]王春丽.大数据时代旅游管理专业教学创新研究[J].中外企业家,2015(10).

[3]彭惠林.基于大数据的信息化时代高职旅游管理专业案例教学手段应用研究[J].旅游纵览,2017(2).

[4]潘冰,李云鹏.中国旅游发展笔谈——旅游大数据的现状与未来(一)[J].旅游学刊,2017(9).

[5]潘冰,李云鹏.中国旅游发展笔谈——旅游大数据的现实与未来(二)[J].旅游学刊,2017(10).

[6]薛武.“大数据”在我国旅游业的运用现状及前景分析[J].旅游纵览,2014(10).

数据分析的前景篇6

关键词:人行道景观;问卷调查;主成分因子分析;线性回归分析

目前,我国对城市人行道景观设计的研究工作还比较滞后,为人们营造一个安全、便捷、舒适的步行空间,强化道路沿线景观,已成为推动我国城市景观建设发展的重要课题。

本文通过对人行道景观满意度进行问卷调查,研究成都市人行道现状。在收集到满意度数据以后,使用主成分分析法进行数据处理及对比分析,归纳目前成都市人行道存在的问题,以及影响市民对住宅区人行道景观满意度的重要因素,最后,提出建议,进行总结。

一、调查问卷的设计

1.问卷调查方法

本次问卷通过实地采访当地居民,并根据调查对象样本选择15个区域进行投放,每个区域保证5份左右的问卷投放量,可以尽量避免一些意外情况。因为是实地采访,所以数据偏差的可能性较低,真实性较高。

2.问卷的设计

(1)问卷的构成

本问卷主要从人行道的环境、功能性、安全性,以及舒适性等角度入手分析人行道景观各因素对市民感官的影响。

从环境角度看,问题主要涉及:①人行道绿化是否足够好;②人行道各设施摆放是否足够美观。

从功能性角度分析,问题有:①道路铺装是否完好;②能否满足行人需求。

从安全性角度入手,问题有:①防护设施如防护栏等是否完好;②安全警示牌等是否已经设立;③有无车辆违章行驶、停放现象。

从舒适性角度考虑,问题有:①道路两边店铺、摊贩等有无占道经营现象;②道路各设施摆放是否美观;③道路是否平坦。

(2)问卷的评价量表

本卷采用5级分数的李克特量表进行评价。李克特量表由一组对某事物的态度或看法的陈述组成,回答者对这些陈述的回答被分成“非常同意、同意、不知道、不同意、非常不同意”五类,或者“赞成、比较赞成、无所谓、比较反对、反对”五类。人们在态度上的差别,就在这一组的多样选择中被巧妙地反映出来。这五个选项分别记为5、4、3、2、1分,每个被调查者的态度总分就是他对各道题回答所得分数的加总,这一总分可说明他的态度强弱或他在这一量表上的不同状态。

二、调查数据分析

1.Kmo与Bartlett的球形度检验

由于主成分因子分析的默认前提是数据组中各变量之间必须具有相关性,否则各变量之间没有共享信息,无法进行分析。所以在进行主成分因子分析之前,需要做Kmo与Bartlett的球形度检验判断这组数据是否适合做主成分因子分析。本次检验结果:Kmo值为0.765。因子的适应性大于一般要求的0.6的标准,因此可以做因子分析;其中最后一项的显著性的值为0.000,小于0.05,通过了标准值为0.05巴特利球形检验。因此,可以得出结论:这组数据适合进行主成分因子分析。

2.公因子方差

在进行主成分因子分析时,因为预先所选择的多个指标并不是完全相同的,将这些并不相同的指标强行归为几个类别,在这个过程中,就会产生信息的损失。为了检查所收集的数据在主成分因子分析过程中的信息损失程度,就要进行信息损失度的检查,也就是公因子方差的测算(如表1)。

在表中可以清晰地看到各个指标在进行主成分因子分析时的信息提取度,也就是第三列的数据,而所需要的信息损失度则等于起始值减去信息提取度。根据一般情况,信息度损失达到40%以下,选出的信息度提取度比较少,即信息损失度比较大。据表格得出四条指标信息,即人行道给市民的感受(提取54.2%,损失接近50%);人行道的卫生条件(提取57.1%,损失接50%);人行道的铺装(提取39.2%,损失超过60%);人行道与机动车道的隔断(提取56.7%,损失接近50%)。因为本次实验所选取指标的数量过少,如严格按照一般标准进行分析则会损失过多数据,所以在这里稍微放宽标准,选取信息损失度为50%以下的指标为合格指标。因此,最终信息损失度超标的只有一个指标,即人行道的铺装,它的信息度损失超过60%,超出了之前所制订的50%的标准,因此这个指标不合格,在之后的数据分析中将被弃用。

3.主成分分析

在做完前面两步的检验工作,验证了所选取指标的适应性与信息流失度之后,就正式开始分析数据的主成分因子,在将所有数据输入到SpSS之后,选择因子分析开始分析,得到的主成分信息如表2。

如表所示,这组13个原始指标最多可以分为13类,即13个主成分,但是目的是将这13个变量分为尽可能少的类别,尽可能达到更少的信息损失。在理论上,所提取所有的主成分的累计方差贡献率要大于等于85%,这个数字也意味着信息的损失量在15%以内。但是本次实验所选取变量数量较少,而且不需要达到严格的科学实验标准,因此在这里使用的是按照特征值大于1,与此同时累计方差贡献率大于60%的原则选取主成分因子。

在这份表中,共有3个主成分特征值大于1,它们的累计贡献率为64.936%,即前3个主成分因子能解释原有13个变量64.936%的总方差。为了更好地描述主成分信息,在此使用图表的形式来表现它。

三、住宅区人行道景观改善建议

根据已经完成的住宅区数据主成分因子分析,影响市民对住宅区人行道景观的满意度的主要因素有3类,外部环境因子、内部条件因子、感官因子。根据这些因子,做了如下分析。

1.因子1――外部环境因子,反映人行道的外部环境

住宅区人行道主要是为人们避开交通要道、安全自由行走而设立的,通常宽度不大,一般设计宽度为1.22米,大约能够满足两个成年人并列行走的宽度。

住宅区人行道与城市步行道有所不同。住宅区人行道通常是柔和弯曲的小道,这就使住宅区人行道有了更多的、更自由灵活的设计空间。人行道景观设计不是简单的绿化,还要关注到人文性、美学性等多个方面,既要考虑到安静舒适,又彰显园林的个性化特色,使劳累一天的住户产生家园般的归属感。所以设计不能只重视外观表现,更要做到合理节约住宅区有限的空间、节省投资者投入的费用,还要做到私密空间与公共空间和谐统一。

因子1支配的变量有更高的要求,这些变量主要有人行道绿化种类、人行道与机动车道的隔断、人行道的嘈杂程度、人行道的拥挤程度。

针对这些变量,在景观设计中要充分体现尊重、关心每一个小区的住户,使用户置于小区的景观中,如同置身到大自然中;要尊重自然、顺应自然、因地因势而行,合理划分车流人流,满足人们对景观的游览需求。在设计中可采用一排行道树、双撑行道树、花圃林荫路等绿化形式。把人行道和机动车道进行隔断,这样既保护行人的安全,又削弱人行道的嘈杂声。

针对人行道的交通功能,减少人行道的拥挤程度。在设计中应根据不同的地域特性营造不同的自然景观,在满足小区步道功能的基础上,采用花坛内间植行道树、行道树与小花园相连的形式,以曲代直,力争做到收放自如、绿树红花相映、随坡就势而隐、遇水逐浪而现。巧妙运用摄像手法中的借景、框景、障景等造景摄影技巧,拓展景深,实现室内空间向室外空间延伸,从视角上增大小区的活动空间,营造视觉上的审美功能,争取使住户获得更美好的小区景观体验。

2.因子2――内部条件因子,反映人行道的本身条件

《城市道路交通规划设计规范》(GB50220―95)中明确提出人行道的最小宽度不得小于1.5米。行人在人行道上的行走状态不可预见,会出现顺行、逆行、并行等多种情况。人行道路作为城市道路交通的重要组成部分,既是城市交通运输的重要通道,又是人们户外活动的另外一个重要场所。

因此因子2支配的量为本设计提供了更大的设计空间。这些变量主要有人行道绿化面积、车辆占道现象、人行道宽度、人行道上的休息座椅等因素。

针对这些变量,不能盲目地追求气势宏大,追求花坛最大、造型最多,道路最宽、步道最长,道路的组合材料最好看,设施最美等形式。这会使设计失去人行道应有的功效,不但造成巨大的财产损失,还会造成人为的拥堵。城市人行道要兼顾行人出行的实际情况,提供更便利、更快捷、更轻松、更悠闲的出行方式。设计中应本着当曲则曲、当窄则窄的原则,尤其是人流比较集中的地区不可布置弯弯曲曲的林荫小道,在人流较少的地方可添加一些儿童娱乐区,或设置一些纳凉休息的亭苑、座椅,设置阅报栏、雕塑、灯光、垃圾箱等公共设施。在满足人行道路基本功能需要的同时,又带有曲径通幽之感。这种慵懒休闲气息,既带给人们美的享受,又可缓解人们日常生活工作中紧张的情绪。

3.因子3――感官因子,反映人行道给市民的感受

繁华的都市内涵主要建立在城市人群感受的基础上,要根据行人不同的使用需求,突出行人日常生活和休闲的特点。

在因子3支配的变量中更注重人行道给市民的感受、人行道的卫生条件、人行道的健身设施、市民在人行道上看到天空的多少(街道两边建筑的高度)。

很多地方小区健身场所匮乏,附近又无大型休闲场所,不少居民只能挤在路旁的人行道健身,而此处靠近车流往来的马路,存在严重的安全隐患。因此,在人行道的设计中应采用多样化的布置,丰富城市文化内涵并改善街道生态环境,必须合理利用空间:可因地设绿、可增设形态各异的小花坛或构思精巧别致的景观小品或健身场地。在建设人行道的同时可以设置健身步道,并在沿途设置健身导向标志。行人走在路上可欣赏沿途美景,感受盎然绿意相伴,无论是跑步、散步还是骑行都是惬意的放松方式。这种带有城市特色的道路文化,安静、富氧、赏景、健身,造就舒适、安全的景观,都将增加行人在行走过程中的良好情绪体验与美的感受,满足人们审美的需求。

四、结语

综上所述,根据线性回归分析,在所选取的13个指标中,人行道带给市民的感受、车辆占道现象、人行道宽度、人行道上的休息座椅、人行道的嘈杂程度、人行道的拥挤程度,这6大指标能较大地影响成都市市民对人行道景观的满意度,其中影响最大的指标为人行道带给市民的感受。

因此,在改善住宅区人行道景观的工作中,更注意人行道带给市民的感受、车辆占道现象、人行道宽度、人行道上的休息座椅、人行道的嘈杂程度、人行道的拥挤程度等这6个指标,它们主要分布在外部环境因子与内部条件因子中,需要特别注意。

政府要提升市民对人行道景观的满意程度,首先要关注人行道的外部环境与内部条件,重点是提升人行道带给市民的愉悦感,改善机动车占道停车、行驶现象,增加人行道的宽度,增加人行道上休息座椅的数量,降低人行道周围的噪音,缓解人行道的拥挤程度。

参考文献:

[1]KevinLynch.theimageofcity[m].newYork:themitpress,1960.

[2]allanBJacobs.LookingatCities[m].Cambridge:HarvardUniversitypress,1985.

[3][美]约翰・o・西蒙兹.景观设计学――场地规划与设计手册[m].俞孔坚,王志芳,孙鹏,译.北京:中国建筑工业出版社,2000.

[4]芦原义信.街道的美学[m].天津:百花文艺出版社,2006.

[5]魏向东,宋言奇.城市景观[m].北京:中国林业出版社,2005.

[6]刘滨谊.城市道路景观规划设计[m].南京:东南大学出版社,2002.

数据分析的前景篇7

通过异常数据的分析可以将入侵者的攻击流程直观的展示给人们。异常数据分析技术主要包括场景重构和报警融合。场景重构解决了传统入侵检测中存在着较高误报率和漏报率的问题,报警融合将大量的低级报警进行融合,确保攻击场景的完整性。Han等设计了基于关联规则的入侵检测算法,通过对频繁子集的挖掘,成功检测出了已知攻击的变种。赵宁等人提出了基于流程化攻击场景重构技术,采用不同的关联模型对来源不同的报警进行关联,重构入侵者的入侵场景。Daisuke提出了一种基于日志分析方法,通过对计算机网络日志进行分析,构建攻击者的攻击场景。H.achi把计算机网络安全的一些技术应用到入侵检测,得出攻击者的网络攻击流程。

2异常数据分析方法

本文提出的基于场景重构和报警融合的异常数据分析方法,其主要思路是:首先去除攻击失败的报警;然后反向关联,减少场景重构中一些不必要的数据;最后对一些孤立报警进行必要的补充,来保证场景图的完整性。对报警进行精简与合并,此项工作主要由以下两个步骤完成:对具有重复关系的报警进行合并;删除攻击失败的报警。通过寻找各个攻击步骤之间存在的因果关系,将那些大量的、离散的报警合并成同一攻击的不同攻击阶段。本文所使用的算法是在文章的基础上添加了时间约束条件,即两条报警能进行关联的前提是这两条报警的时间差在一定范围之内。对于某一个入侵场景,首先找到该场景中报警类型级别比较高且时间靠后的五条报警,就从这些报警开始向前补充,将这些报警补充完后,判断此场景是否完整,若该场景图还存在遗漏,需要再进行一次遗漏报警的补充,直至场景图相对最完整。

3实验结果及分析

上一节介绍了基于场景重构和报警融合的异常数据分析方法的具体流程,在本小节中,主要是将此方法得到的实验结果进行分析,验证本文所提出方法的必要性与可行性。1)报警融合步骤的必要性报警融合的主要目的是去除原始报警中冗余的报警,通过多次的实验,结果表明了在对报警信息进行关联分析时,必须要采取报警融合技术。2)基于异常数据进行入侵检测的可行性通过上面的实验,可以看出,通过报警融合确实减少了报警数量,但去掉的这些报警是否会影响场景图的完整性,下面对其进行分析。通过上图可以很清晰的看出攻击者的主要攻击步骤,即首先通过主机进行端口扫描,然后通过asp注入,添加超级用户,然后通过该用户对该网站进行操作管理,最后入侵网站成功。实际检测出的攻击场景图由图中虚线表示,即成功关联出了具有关联关系的报警信息,进行mSSQL注入时,会通过pangolin在主机增加一个用户,然后将此用户加入到管理员分组,提升此用户的权限,通过本文设计的系统进行关联时,将此步骤关联出来了。由此可以看出,本文的方法很大程度上避免了漏报,证明了该方法在可行性方面是没问题的。

4结论

数据分析的前景篇8

关键词:mongoDB;物流流量分析;关系型数据库;大数据;性能优化;集群;分片

中图分类号:tp311文献标识码:a文章编号:1009-3044(2013)33-7627-04

目前随着网络信息化、电子商务和物流业的爆炸式发展,我们正加速进入数据快速增长的“大数据”时代,“大数据”已经在各方面对人们的生活带来深刻的影响。而传统的数据存储与分析技术在“大数据”时代也显得力不从心,“大数据”给it产业带来了新的挑战和机遇。

1概述

目前物流行业蓬勃发展,各大物流企业在热点时间段频频爆仓,大量快件滞留在始发站和中转站,给物流企业带来了非常大的管理压力,所以物流订单流量进行实时分析和非实时统计分析成为物流企业规划物流运力和仓储能力重要决策数据。而目前物流企业订单管理系统大部分基于传统关系型数据库,这对于订单跟踪目前还能胜任,但是对于海量的数据统计分析则显得力不从心。

1.1问题描述

一方面,物流企业的订单管理系统目前主要使用传统关系型数据库如oracle,SQLServer等。在数据库中存放订单配送的主要数据包括以下两个方面:

1)订单的基本信息,包括订单编号、发件人信息、收件人信息、发货时间、发货地点、收货地点等信息。

2)订单配送过程的轨迹信息,在关系型数据库中会形成模式如(单号,出发地,到达地,出发时间,到达时间)的多条记录。例如一件物品从上海发往合肥客户,经由轨迹信息就是上海昆山南京合肥。会形成(iD1,上海,昆山,time1,time2),(iD1,昆山,南京,time3,time4),(iD1,南京,合肥,time5,time6)三条记录。

由于订单数目巨大,形成的轨迹信息往往是数以亿计,甚至更多。对于统计在某段时间内容从地点a到地点B的总订单数等信息往往要等待很长时间,甚至对于更为复杂的统计分析讲无法给出查询结果。

另一方面,目前现有系统已普遍使用,不适合更换现有数据库,我们需要在不更换现有数据库的基础上提供相应的统计分析查询服务。

基于以上两方面问题,我们提出基于mongoDB的物流流量分析性能优化方案。

1.2相关技术

mongoDB是一个开源的文档类型的,基于分布式文件存储的数据库。旨在为web应用提供可扩展的高性能数据存储解决方案。mongoDB支持松散式数据结构bson格式,可以存储复杂的数据类型。可贵的是它的查询语言非常强大,可以适用于多种查询场合。

mongoDB具有面向集合存储、高可用、高性能的特点,且具备通过shard模式支持横向扩展性,为大数据存储与处理奠定了基础。

2方案设计

2.1处理流程

从图1我们可以看出方案处理场景主要包含三部分:

1)系统接入时从原oracle数据库全量批量式导入订单及其轨迹信息进入分布式mongoDB数据库。

2)物流订单入库、出库、中转及配送的轨迹信息更新时增量记录于原oracle数据库及mongoDB数据库。

3)物流流量分析人员基于mongoDB数据库内数据实时统计分析流量数据。

以上使用场景对mongoDB提出了具有良好数据写入性能和数据查询新能的要求。另一方面该使用场景对于数据的高可靠性没有较高要求,系统的写入和查询性能更为关键。

2.2mongoDB的数据写入性能分析

mongoDB的数据写入性能测试主要包含以下几个场景模式,包含单机与集群分片的性能比较。

2.2.1正常模式数据写入

2.2.2批量模式数据写入

2.2.3安全模式数据写入

2.2.4数据写入模式的选择

通过上述3种写入模式的分析我们可以看出,mongoDB的正常模式写入和批量模式写入具有较好的写入性能,但是批量模式并没有预期上比正常模式有更高的性能,主要原因在于写锁的存在,导致了并没有较好的性能提升。而安全模式为了保证数据的不丢失性,写入性能较差,考虑到我们的使用场景对于单条数据没有较高的数据可靠性要求,所以我们采用mongoDB的正常模式作为系统实现方案。

另一方面我们的订单数据是海量的且持续增长的,考虑到单机存在不能满足数据存储的要求,我们采用集群式的分片模式,这样在后期数据增长的情况下可以做到平滑扩容。

3性能优化方案效果分析

基于以上方案我们设计实现了该方案,并针对千万级订单、亿级订单轨迹信息进行了系统测试,表明基于mongoDB的流量分析较传统oracle数据库有着更好地查询与统计性能达到了我们预期目标。

针对物流流量分析场景我们进行了物流站点吞吐量和路径流量等多种实际数据测试,均表明mongoDB具有更高的查询性能。

3.1实验环境

实测环境的数据库版本为:

mongoDB:2.4

oracle:10g

3.2物流流量分析场景实验结果

3.2.1物流站点吞吐量分析

在表1的实验环境下,我们就各物流站点的吞吐率进行了统计分析,实验表明mongoDB在做站点吞吐量分析时性能较oracle更优。具体数据如表2。

3.2.2其他各种查询条件比较

我们也对其他复杂查询统计条件进行了测试比较,mongoDB在查询性能上较oracle整体具有优势。详见表3。

4总结

本文针对物流行业订单轨迹的数据分析性能优化进行了探索,证明了在此场景下以mongoDB为代表的非关系型分布式数据库具有良好的扩展性和性能,为我们在“大数据”时代深度发掘数据内在商业价值提供了有效的分析手段。同时我们也能看到目前开源的大数据存储、分析解决方案层出不穷,为迎接“大数据”时代的到来奠定了技术基础。

参考文献:

[1]mongoDB使用手册.http:///manual/.

[2](美)霍多罗夫,(美)迪洛尔夫.mongoDB权威指南[m].程显峰,译.北京:人民邮电出版社,2011.

数据分析的前景篇9

关键词:信息系统;数据库;景区门票

中图分类号:tp311.52文献标识码:a文章编号:1007-9416(2017)04-0176-03

1绪论

传统的景区管理方式随着现代技术的发展已经显得越来越力不从心,传统的管理方式已经无法满足现代人们对景区的管理方式的要求。随着旅游人群出行规模不断增大,景区游客的数量呈指数型增长,随着景区游客数量的增加给传统的景区管理方式提出了严峻的考验,使得景区的管理者花了大量的人力物力来完善景区管理,但是还是不能满足日益增长的游客数量。这大大提高了景区管理的压力,对于旅游景区的经费支出也提出了更高的要求。引入旅游景区管理系统,不但可以降低旅游景区管理工作者的工作量,节约管理经费,同时还能提高管理的灵活性。国内现有的旅游景区管理系统大多只能进行旅游景区信息登记,二维表存储的方式已经不能满足现代旅游景区管理的方式,从而要求开发新的旅游景区管理系统来进行管理。

2系统研发的相关技术

是对aSp的一次全新的升级,并不是一次简简单单的结构升级而是对网页设计框架的全新改变,包括webForms和webservice两个重要组成部分。全新升级的的程序呈现的页面后缀变成了.aspx,能够使得被调用和执行的页面对公共的语言库进行重新的编译,再一次进行调用时就不会出现这样编译。所以,第一次使用时速度较慢,兼容性较强的aSp文件也能在.net的结构框架中进行编译运行,其之间的不同就在于后缀名的不同。升级的aSp运行一般有五个步骤,分别为请求、分析、编译、组装、缓冲。第一页面分析程序能够执行服务器的分析请求,之后对分析处理的数据通过编码器进行重新的编译,继而输入到页面的处理器的组装缓存部分,最后进行内存输送和缓存。升级版本的能够利用其效率的提升进行,对一次的编译行为进行多次的处理,保证了升级后效率的提升[1]。

SQLServer2005数据库管理系统。本套系统设备使用微软的SQLServer2005作为我们的系统后台处理数据库,在和完美契合的同时,还能够对海量数据进行各种的操作,包括对数据进行修改、删除、增加等操作。

3系统规划与需求分析

3.1系统可行性分析

对旅游业的信息管理信息系统的建设如何高效、有效的进行,主要从资金、管理、技术等角度进行分析,论证了对信息系统建设的可行性[2]。(1)利用各种各样的先进技术。目前国内的各大景区也开始对旅游信息系统的研究,我们对先进的管理信息系统的开发可以吸取他们的先进经验。(2)系统信息建设对管理旅游景区水平的提高至关重要,各景区愿意投入大量资金投入到新系统的建设中。(3)信息系统能够有效的提高工作效率,帮助相关人员减少调阅路线时间、找不到线路等问题。

3.2系统用户分析

安全可以分为三个部分,系统安全、网络安全和应用软件安全。其中系统安全对系统的安全性能的要求较高,不能有比较大的漏洞和隐患;要维护网络的安全必须检测网络中的出现的BUG,利用有效的工具手段排除隐患,维护网络安全;保证应用软件的安全,必须对检测系统进行完善,保证软件的运行状态不会影响整个系统的运行效率,与此同时也要保持对任务运行的准确高效,要保证系统的高效稳定运行。

3.3主要流程分析

(1)文件资料管理流程分析。图1为文件资料管理流程图,对景区的各种文件进行统一的管理,方便管理者进行文件的查询。(2)电子门票管理流程分析。①所有的门票信息都放在同一目录下的预文件库里面,由管理部门统一管理。②相关的管理人员要检查门票的是否真实和完整,进而将有错误的门票退回整理。③游客进行门票的预定或者购买的时候要首先查询是否有门票可以出售或者是可以预定。④相关人员能够检查门票进而得知保管期限和关键内容。(3)景区气象信息监控。主要完成旅游景区气象环境地图显示、气象信息管理和警报信息管理功能。①气象环境信息地图显示。系统通过和气象部门的系统进行集成,通过调用气象部门的数据来显示到旅游管理信息系统中,可以实时的提供景区气象环境信息。②气象信息管理。气象管理是对景区气象信息提供实时预告,通过景区门户网站或者是景区广播的形式实时的预告气象信息,以及通过气象部门的数据来对景区气象信息实现预测管理。③警报信息管理。警报信息包括对气象信息的报警,游客信息的报警以及对文物相关信息的报警,同系统的报警功能可以更好的对旅游景区进行管理和控制[3]。(4)基本信息管理流程分析。1)用户信息主要是包括对于每一个用户的姓名,系统的登陆账号和密码、联系方式等各种各样的信息,并且实现对信息的高效管理包括对信息的添加、修改和删除。2)景区如何对基础信息进行管理。此功能模块主要对景区的总体介绍以及各个旅游景点的介绍,用户信息查询以及气象信息查询等功能进行管理。

4系统功能设计与实现

4.1系统设计目标

严格遵守旅游管理信息系统的诸多原则,就有希望实现建设目标的完美呈现。(1)安全性强。对旅游景区里面的文物要求具有严格保密,并且保证文物的绝对安全,安全性能的指标凌驾于其他的任何指标之上。(2)效果好。对旅游旅客的信息管理系统的应用,能够实现对旅游信息的最优化的采集、分析和处理,我们必须保障系统运行的性能强、效果好。(3)稳定性强。必须保障系统的平稳运行才能保障对信息的安全高效处理。(4)简化方便的操作页面。实现人际交换系统的最优化,保证用户的使用体验。

4.2系统功能设计

系统总体功能系统是系统总体架构的具体设计,本系统包含了四大功能模块分别是:基本信息管理,游客数量控制管理、历史文物管理以及气象环境监测管理,四个功能分别又进行了功能模块的细分,多个功能模块相互进行信息共享,共同完成了景区监控管理[4]。

4.2.1数据库概念设计

数据库就是一个系统运行过程中所涉及的各种事务过程进行和处理的数据模型。能够为我们现实生活中的各种业务提供详细的数据,并且对数据进行分析和处理,判断各个数据之间的相互关系。其设计模型应该是抽象、模糊的,和普通的数据在服务器上的运行状态是毫无关系的[5]。

4.2.2数据库表设计

(1)用户信息表。用户信息表包括用户iD、用户名、密码、用户类型、用户姓名、性别以及电话号码。用户登录时需验证此表中的用户信息,结构如表1所示。

(2)景点信息表。景点信息表包括用景点编号、景点名称、景点游客容量、景点描述信息,结构如表2所示。

(3)游客信息表。游客信息表t包括游客编号、游客地址、游客来源以及游客的人数等信息,结构如表3所示。

(4)风力信息表。风力信息表包括风力记录时间、记录地点、记录人以及记录结果等,结构如表4所示。

5结语

本文讨论了基于3.5平台设计实现了旅游管理信息系统,提升了景区管理效率以及景区管理的水平,完成了以下工作:我们详细的研究了景区监控系统的发展状态和目前的研究进展,目前的系统能够实现优化的前台页面和结构简化的后台数据结构搭载,有效的降低了前期的建设费用和后期的维护费用。为了保证系统的研发和数据的稳定性,需要提高数据库的安全机制和其内部的戎帽砀竦脑诵谢制,能够帮助整体安全的性能的提升。目前最广泛使用的模式就是浏览器模式,能够保证系统的实时和扩展,优化结构提高用户的友好体验。

参考文献

[1]孟洛明,元峰.现代网络管理技术[m].北京:北京邮电大学出版社,1999.

[2]邱志宏,黄力.电信资源管理系统设计与实现[J].中国市场出版社,2005(32):112-113.

[3]刘畅,何林宏.云南电力通信资源管理系统的组建及其应用[J].电力系统通信,2006(09):21-23.

数据分析的前景篇10

【关键词】SpSS百度指数游客量相关性分析

一、前言

随着我国经济的迅猛发展,旅游业已成为中国经济发展的支柱性产业之一。越来越多的人通过参与旅游活动丰富物质文化生活,因此也带来诸多旅游城市游客量的逐年攀升。尤其一些热门的旅游景点,在“五一”、“十一”等大小长假期间更是出现游客量爆棚甚至超负荷承载的状态。因此,关于游客量的分析研究对城市旅游业和景区生态环境的可持续发展、旅游资源的合理规划和开发具有重要的现实意义。

互联网技术的普及,大数据、云平台等新兴技术的成熟落地,为蓬勃发展的旅游业注入了新鲜的血液。旅游企业选择互联网这一重要平台旅游信息,游客的需求和体验也不再局限于传统的旅游方式,互联网技术可随时为游客提供个性化的服务和实时有效的旅游信息。越来越多的旅游者通过网络搜索技术,有针对性地获取实时有效的旅游信息。根据CnniC的研究显示,搜索引擎是旅游用户在线获取旅游信息的首选渠道,占比近8成。

可见,旅游业与信息化的融合愈加突显。运用大数据、搜索引擎等互联网技术分析旅游的网络关注度与现实旅游行为的关系,对旅游管理部门做出科学、合理的决策和安排具有重要的现实意义,为游客量的预测研究提供重要的理论依据。

二、国内外相关研究

目前,基于SpSS的游客量相关研究的数据基础主要以实际游客量的历史数据为主。张红贤等收集了1978―2003年中国入境游客量的值,运用多元回归分析的方法,对我国入境游客的规模进行了预测。黄宏等基于1979―2007年中国入境旅游人数资料,利用SpSS统计分析软件,预测中国入境旅游人数。结果表明,该方法准确可靠高、方便快捷,适用于入境游客量的预测。李世泰等基于山东省1992―2008年国内游客量,利用SpSS软件定量分析模型分析了不同时间尺度旅游客源市场预测方面的客观差异。随着基于信息技术对社会行为的深入研究,网络搜索技术的旅游行为预测研究主要集中在网络关注度与旅游客流关系的研究。路紫、赵亚红、吴士锋、韩冰运用网上查询系统、网站访问数量统计工具,获取旅游网站访问者的时间分布资料,分析了网络信息流对旅游流的导引作用。梁明英、王丽娜以山东泰山为例,通过对景区游客进行问卷调查,调研了旅游网络信息在景区游客中的应用,分析出景区旅游网络信息对该旅游目的地游客行为模式的影响。戴维森等(Davidson,etal.)通过实证对比分析以台湾为旅游目的地的旅游网站的信息流与现实旅游流,发现网站信息流对游客旅游行为具有引导潜力。

以上国内外文献研究显示,以往研究主要基于实际游客量的历史数据的SpSS相关性分析和网络搜索技术两种方法分别对游客量进行了论证分析,但将两种方法相结合的分析研究文献较少。本文将借助SpSS软件,通过收集能够反映旅游关注度的网络关键词的百度搜索量指数,对北京故宫在2010年五个假期的实际游客量进行相关性分析。

三、相关性分析

1、关键词的选取

由于游客的异质性,他们对事物关注的角度会有差异,因此在出游前检索的相关信息和网络关键词具有多样性。根据旅游理论基础、游客的行为特点以及游客在出游前对旅游目的地信息的关注,对游客在出游前对旅游目的地(景区景点)旅游信息所关注的内容的分析,选取出旅游目的地(景区景点)的名称、图片、旅游路线、门票价格等与旅游目的地(景区景点)相关的基准关键词,利用网络搜索引擎中的关键词推荐功能,确定本次研究的关键词为:故宫、北京故宫、故宫博物院、故宫门票、北京故宫门票、故宫门票价格、故宫地图、北京故宫地图、故宫图片、北京故宫图片、故宫博物院图片、故宫旅游、故宫开放时间共13个关键词。

2、数据的收集

根据《故宫博物院年鉴2010》收集到2010年主要节日(春节、清明节、劳动节、端午节、中秋节、国庆节)假期期间,北京市故宫博物院所接待的游客总量。其中,十一国庆节期间的游客量在6个假期的游客总量中居首位,为61.292万人次。

百度公司推出的百度指数平台,可以提供各网络关键词在某段时间内的搜索量指数。通过百度指数平台,查询、收集到已确定关键词(共13个)在2010年五个假期期间的节日当天、提前7天及延后2天共共10天内每天的关键词的搜索量指数。

3、百度关键词搜索量指数与实际游客量相关性分析

通过SpSS数据统计软件,对13个关键词的日搜索量指数与实际游客量进行pearson相关性分析,得出每个关键词在研究时段内每天的关键词搜索量指数与实际游客量的相关性数据,其中选取相关性最大的数据列表(见表1)。

通过分析发现,在所选取的13个关键词中,有9个关键词的搜索量指数与实际游客量的pearson相关系数在0.75以上,相关性较大。因此,相关网络关键词搜索量指数与实际游客量之间存在较明显的相关关系,且最大相关系数出现在节日前2―5天的时间范围内。在9个相关性较大的关键词中,有4个关键在0.05水平上显著相关,分别是故宫门票、故宫地图、北京故宫地图、故宫开放时间。其中搜索量指数与实际游客量相关性最大的关键词为“故宫开放时间”,其pearson相关系数为0.928。由此,故宫景区游客在出游前对门票价格、相关旅游路线图和开放时间的关注度较高。

四、结论

本文以北京地区的热门景区――故宫为例,基于SpSS的pearson相关性分析方法,对所选取的13个关键词的搜索量指数与研究时段内的实际游客量进行了相关分析。主要得出以下结论:故宫景区在2010年的相关网络关键词搜索量指数与实际游客量之间存在较明显的相关关系;故宫游客对所关注的出游信息进行网络搜索查询的时间一般集中在出游前2―5天内;故宫景区游客在出游前最关注的出游信息主要为景区门票的价格、相关旅游路线图和景区开放时间。

基于相关性分析方法,借用信息技术提供大数据对游客量进行的相关分析,对旅游管理部门做出科学、合理的决策和安排具有一定的现实意义,为游客量的预测研究提供重要的理论依据。

【参考文献】

[1]百度数据研究:2014年中国旅游百度指数报告[eB/oL].中国互联网数据资讯中心,2014.

[2]张红贤、马耀峰:中国入境旅游市场的多元回归预测[J].资源开发与市场,2005(2).

[3]黄宏、邓婕、常彦祥、李文凤、杨东方:SpSS在旅游人数的预测应用[J].山地学报,2008(S1).

[4]李世泰、赵亚萍:基于不同时间尺度旅游客源预测模型比较研究――以山东省为例[J].北京第二外国语学院学报,2011(9).

[5]路紫、赵亚红、吴士锋等:旅游网站访问者行为的时间分布及导引分析[J].地理学报,2007(6).

[6]梁明英、王丽娜:网络旅游信息对游客行为模式影响的调查分析――以泰山游客为例[J].泰山学院,2008(1).