智能评语设置教程收集70句

时间：2019-09-18 03:03

好的教学设计与反思互评语有利于指导思想梳理培训内容的线条，提出部分内容整合的建议。如下是教学设计与反思互评语内容，为大家提供参考。

教学设计与反思互评语

一：教学设计的成果

教学设计是运用已知的教学规律去创造性地解决教学中的问题，其成果或产物是经过验证的，能实现预期功能的教学系统。教学设计可以分为宏观层次和微观层次，不同层次的教学设计成果表现不同。

1：宏观层次的教学设计主要面向大型，复杂的教学系统，如个别化学习系统及一个学校或一门新专业的课程设置，课程开发等，其教学设计成果可以是学习系统，网络课程，课程及教材，教学资源，题库系统，评价系统等。

2：微观层次的教学设计主要面向具体课程内某个单元，某堂课的设计，其教学设计成果大多是面向课堂教学，单元教学的教学设计方案，媒体教学材料，学习资源，活动模板等。

由于教学设计的成果较多地体现在微观层面的课堂教学方案和媒体教学材料之中，而且只有课堂教学方案和媒体教学材料有机结合，才能真正在教学中发挥作用，提高教学效果，在当前的课堂教学设计中，这两者已经成为教学设计成果不可或缺的内容。因此，本节着重讨论如何对包含这两部分内容的教学设计成果进行评价。

二：教学设计成果评价的原则

1：完整性和规范性

一个完整的课堂教学设计成果至少应包含两部分内容：一份规范的教学设计方案，一份媒体素材清单及多媒体资源。

一份规范的教学设计方案必须体现一个完整的教学设计过程，所有必需的环节应明确写出，而且要前后一致，是一个整体的解决方案，而不是各个要素的简单堆砌。

（1）教学目标阐述：确定的教学目标要体现新课程标准的理念，不仅反映知识和技能，过程与方法，情感态度与价值观三个维度的目标，而且能体现不同学习者之间的差异；目标的阐述清晰，具体，不空洞，不仅符合学科的特点和学生的实际，而且便于教学中进行形成性评价。

（2）学习者特征分析：从认知特征，起点水平和情感态度准备情况以及信息技术技能等方面详细，明确地列出学习者的特征。

（3）教学策略选择与活动设计：多种教学策略综合运用，一法为主，多法配合，优化组合，教学策略既能发挥教师主导作用又能体现学生主体地位，能够成功实现教学目标；活动设计和策略一致，符合学习者的特征，教学活动做到形式和内容统一，既能激发学生兴趣又能有效完成教学；恰当使用信息技术；活动要求表述清楚。

（4）教学资源和工具设计：综合多种媒体的优势，信息技术的运用有奖资源能促进教和学，发挥必需的作用。

（5）教学过程设计:教学思路清晰（有主线，内容系统，逻辑性强），结构合理化注重新旧知识之间的联系，重视新知识的运用之妙教学时间分配合理，重点突出，突破难点；有层次性，能够体现学生的发展过程。

（6）学习评价和反馈设计：有明确的评价内容和杳无音信有合理的习题练习，练习的内容次数比较合理，有层次性，既能落实双基要求，又注重学生应用知识解决问题能力的提高；注重形成性评价，提供了评价工具包针对不同的评价结果提供及时的反馈，而且以正向反馈为主要根据不同的评价信息，明确提出矫正教学行为的方法。

（7）总结和帮助：对学生学习过程中可能会产生的问题和困难有所估计，并提出可靠的帮助和支持者有完整的课后小结；总结有助于学生深入理解学习的主题；重点关注潜能生的需求。

一份完整的媒体素材清单及多媒体资源指应提供教学涉及的各类媒体素材清单，如投影，幻灯，挂图，模型，计算机软件等。

2 可实施性

评价一个教学设计成果的优劣，还应从时间，环境，师生条件等方面来考虑其是否具有较强的可操作性。

（1）时间因素：运用此成果于教学时，所需时间的多少，包括老师的教学时间，学生的学习时间等。教师的教学时间应含学生完成教师布置的作业的时间，教学占用学生的课外时间量等。

（2）环境因素：对教学环境和技术的要求不高，可复制性较强。

（3）教师因素：方案简单，可实施，体现教师的教学风格，特点及其预备技能。

（4）学生因素：针对学生的情况，对学生的预备知识，技能以及学习方法等方面的要求比较合理。

3：创新性

既能发挥教师的主导作用，又能体现学生的主体地位；教法上有创新，能激发学生的兴趣；有利于促进学生高级思维能力的培养；体现新理念，新方法和新技术的有奖应用。

4：媒体资源的支持性

我国教育技术界曾对音像教材提出了编制原则，这些原则不仅适用于传统的教学材料的评价，同时也是现在各类多媒体教学资源评价应遵循的基本原则：

（1）教育性：能用来向学生传递规定的教学内容，为实现预期的教学目标服务员

（2）科学性：正确地反映了学科的基础知识或先进水平；

（3）技术性：传递的教学信息达到了一定的.技术质量保证

（4）艺术性：具有较强的表现力和感染力；

（5）经济性：以较小的代价获得了较大的效益。

三：教学设计成果的评价方法：

形成性评价是教学设计人员用来获取数据，并通过这些数据修正他们的教学，提高教学效率效果的过程。形成性评价的重点是收集数据，分析数据，改进教学设计。形成性评价开始于分析阶段，持续于选择和设计阶段，如果计划中还有试用阶段，那么还将持续到实施过程的前期。

教学设计成果的形成性评价通常包括六个阶段：自我评价，专家评议，一对一评价，小组评价，实地试验，进行中的评价。理想情况下，这些方法都是依次实施的，当然，在设计实践中，可能不会实施所有的形成性评价方法。

（1）自评：设计者，开发者或设计团队中的一些成员在将方案呈现给专家或使用者评价之前对其进行评价。这一过程通常被称作“内部评议”，一般是在外部评价之前进行。

（2）专家评议：主要指邀请一些内容专家，教学设计专家或者相关领域的专家，针对教学设计各要素的选择或设计提供信息，并（或者）在方案实施之前对其中的各个草拟要素进行评议。

（3）一对一评价：一对一评价有时也被称为对教学设计成果的诊断性评价阶段。在这个阶段中，设计人员往往需要和三名或者三名以上具有代表性的学习者一起工作，从单个的学习者身上采集数据并修正教学材料，其目的是确定并改正教学中存在的明显错误，并从学习者那里获得对教学内容的最初使用数据和反馈。这是设计得首次从学习者的角度出发，对他们在开发过程中所做的决定进行审视，来验证设计师和开发者的预感是否正确，是否存在对目标人群的误解。

（4）小组评价：小组评价阶段往往是由8至20个目标人群的典型代表组成学习小组，利用教学材料自行学习，然后通过对他们的测试来采集所需要的数据。小组评价有两个主要目的，一个是确定在一以一评价后拟作的改动是否有效另一个是确定教学中还存在哪些问题，是否能适用于真实的目标群。

（5）实地试验：实地试验是教学设计结果实施前形成性评价的最后一个阶段，执行人员（通常是指教师）要在一个与教学材料最终使用环境尽可能相像的学习环境中进行评价。实地试验的目的是确定在小组评价之后所做的改动是不是有效，并要确认教学方案在预设的使用环境下是否能够使用。

（6）进行中的评价。进行中的评价是指在教学实施之后，就教学对学习者的学习，工作和应用知识解决问题的效果所进行的评价。在前面的五个阶段，主要都是解决教学方案的实施问题，包括如何完成教学目标，更有效地实施教学等，没有涉及知识和技能的在其他应用环境甚至生活中的实际问题，而这是教学的根本目的。无论是知识，技能，还是方法，教学的最终目的并不只是为了学生能够掌握或者在学习过程中应用这些知识，技能和方法，教学的最终目的并不只是为了学生能够掌握或者在学习过程中应用这些知识，技能和方法，而是在最终需要这些知识，技能，和方法的环境中进行创造性的运用。因此，教学设计人员不能忽视这一点，应该在合适而可行的时候，对学生的应用情况进行评价，以确定学生的知识，技能和方法是否能够保持，是否能在其他应用环境中使用。

四：说课

说课是一种教学研究活动，是提高教师教学能力的一个有效手段。它要求教师以教育理论，教学大纲，教材为依据，针对性某一课题的自身特点，结合教育对象的实际情况，于授课前面对领导，同行或者评委口头表述该课题教学的具体设想，设计及其理论依据。

说课与授课既有相同点，又有不同处，其相同点在于二者都是某一课题的教材，不同处在于：

第一：目的不同。授课的目的是将书本知识转化为学生知识，进而培养能力，进行思想教育，即使学生会学；说课的目的则是向听者介绍一节课的教学设想，使听者听懂。

第二:内容不同。授课的主要内容在于教哪些知识，怎么教，说课则不仅要讲清上述的主要内容，而且要讲清为什么这样做。

第三：对象不同。授课的对象是学生；说课的对象是领导，同行或专家，评委。

第四：方法不同。授课是教师与学生的双边活动，在教师的指导下，通过读，讲，议，练等形式完成；说课则是以教师自己的解说为主。

五：如何说课

1 说课的内容：

主要有：

（1）说教材和目标。针对教学内容及教学内容所处的位置，前后内容的衔接，说清教学大纲的要求，教学目标及确定本次课的重点，难点。

（2）说学习者特征。从智力因素和非智力因素两个方面来介绍学习者的特征。

（3）说教学思想。即说出课的指导思想，主要的教学构思。

（4）说教学过程。针对本次课的特点和学生基本情况，结合教师本身优势，说出课堂教学结构，教学思路，教学方法，媒体应用等。

（5）说评价。说出在课堂教学中应学习者的学习效果进行评价。

2 说课应遵循的原则

第一：理论联系实际原则。说课是教学与研究相结合的活动，所说的内容是教学设想和理论依据，所以教者既要说清教学设计，又要说清设计的依据，将实践经验上升到理论认识，实践在理论指导下，理论与实践统一。

第二：科学性原则。科学性原则是教学应遵循的基本原则，也是说课应遵循的基本原则，它是说课质量高的基础。说课应做到分析教材正确，准确，透彻，教学目的确定，教法设计合理。

第三：创新性原则。说课是深层次的教学研究，一节示范性的说课，对教学具有很重要的指导意义，所以教者在说课中应注意总结自己的教学经验，形成自己的教学风格，同时要注意发现新问题，提出解决问题的新思路，新方法，这样才能使自身的业务水平不断提高，进而不断提高教学质量。

第四：可行性原则。说课是将

六：什么是好的说课

好的说课有以下几个重要特征：

（1）突出教学理念。从说课内涵看，教学理念是整个说课的灵魂所在。没有教学理念，说课便没了分量。

（2）诠释教学思想。从说课表达形式看，它不是教案的复述，不是对上课的预测和预演，它是丰兼有上述两点的基础上，更加突出地表达授课教师在对教学傻和觉悟的了解与掌握情况下，对教学过程的组织和策略运用的教学思想方法，注重的是对教育理论的诠释。

（3）体现教学能力。从说课过程看，说课促使教师的教学研究从经验型向科研型转化，促使老师由教书匠向教育家转化。因为教学思想的阐发，能够使教师明确教育教学观，展现教学设计，反思教学设计的预测或现象，提升教师的教学能力和升华教师的教学境界。

（4）展现教学境界。教学具有创造性，体现在说课者对于教学准确而独到的见解，对于教学环节独具一格的安排，对于教学策略独具匠心的理解和独特的运用技巧。

（5）展示演讲才华。从说课技能上看，它具有演讲特点。它集中体现说者的心口相应的协调性和面对同行演说的技巧，让听者明白说者所要进行的课的内容，目的，策略，手段及其效果，明白说者的教学思想及行为所引起的效应。说得好的课具有说服力和吸引力。

鉴于重大智能科技成果对社会和企业的重大意义，文章首先研究了国家电力科技奖励办法，分析了国家电网公司现有成果评价体系存在的问题和不足。然后，以国家科技进步奖为基准和理论依据，对公司现有成果评价体系中各项描述性指标进行细化和分解，并设置相应权重以实现指标的量化。最后，在此基础上形成国家电网公司重大科技成果培育的自动指标评价体系和评价模型，此模型更具科学性和客观性。

“科技成果”是人们在科学技术活动中通过复杂的智力劳动所得出的具有某种被公的学术或经济价值的知识产品，目前大体可以分为：理论研究成果、应用研究成果、软件学研究成果以及计算机软件。科技成果是企业的重要精神财富和物质财富，也是衡量从事科技活动人员贡献大小的标志，更是促进企业科学发展的重要智力资源。对科技成果进行有效评价，有利于提高科技成果的转化率，并增加科技人员的研发动力，为社会和企业的长足发展打下坚实的基础。

不过在科技成果评价指标方面，国内外并没有统一的标准和模型，一般都是根据科技成果的类型实施不同的评价标准。在欧美国家，衡量科技成果的两项主要标准主要表现为在国际竞争中是否占有地位以及能否产生经济效益两方面。美国学术界专家在

近年来，我国在科技成果评价领域进行了不少评价方法的研究。不过由于我国科技成果评价还处于起始阶段，在指标体系、评价程序、规范性等方面还有差距，多数地方仍旧普遍采用以定性为主的专家手工评议方法，即建立评审专家委员会，通过专家们对所规定硬性指标进行经验化、定型化的判断来完成选拔优秀科技成果的工作。

1 现有指标体系的不足

国家科技进步奖主要授予在技术研究、技术开发、技术创新、推广应用先进科学技术成果、促进高新技术产业化，以及完成重大科学技术工程、计划等过程中做出创造性贡献的公民和组织。主要包括技术开发类、新技术集成类、先进技术推广应用类、社会公益类、重大工程类、经济技术与管理类六个方面的奖项。国家电网公司现有的科技成果评价体系以国家科技进步奖为依据进行设置，下面以技术开发类项目为例，对具体指标项及指标相关描述进行说明，如表1所示。

对表1所列的各项指标及相应指标描述进行分析研究，可以发现公司现有的指标体系存在如下问题和不足：

①现有指标体系仅包含五项指标，评价指标的设置比较粗化。

②现有各项指标主要以定性描述为主，缺乏定量的指标限制，专家仅仅根据对指标的理解和以往的经验对科技项目做出评价。在依据此指标体系进行科技成果评价的过程中，专家的主观意愿或多或少地影响评价结果，使评价结果可信度下降。

③现有体系在不同的成果各指标之间缺乏量化的综合关联权重分配方法。这主要是因为不同的项目其成果评价侧重指标并不相同，若科技成果着重于体现在理论、方法、技术和工艺等方面所具备的科技水平，则这种情况应以创新度和先进度为主要指标;若科技成果着重于转化、推广应用价值，则应以市场效果、经济效益和社会效益为主要指标。目前主要是通过评判者依据以往经验形成相关结论，不能客观准确地反应实际情况。

针对上述问题，有必要在现有体系的基础上对指标进行细化并增加定量分析过程，使得定量和定性分析相结合，根据科技成果的具体特点来设计评价指标体系，使得科技项目的评价更加公正、公平。

2 重大科技成果评价体系模型

2.1 构建评价指标体系的指导思想与原则

评价指标体系是准确评价科技成果的一种有效方法，其主要作用是对科技成果按照科学、完整、简便的评价指标，进行公正、准确、客观的评价。因此科技成果评价指标体系的构建应该遵循科学性、系统化、通用可比、实用可比、目标导向的指标设计原则。

本文在构建公司重大科技成果评价指标体系的过程中，以《国家电网公司科学技术进步奖励办法》和《国家电网公司科学技术进步奖励办法实施细则》为设计依据，秉承科学，突出不同类别科技成果的原则。力求做到通过此评价体系对科技成果进行整体评价，确定科技成果所处奖项及下一步要努力实现的方向，以引导国家电网公司科技发展方向，力求培育出一批与公司实力相匹配的特、重大成果。

2.2 评价指标细化

将现有指标称为一级指标，针对它的不足，考虑制定多级指标体系逐级予以细化。以一级指标“技术创新程度”为例，一个项目的创新程度主要考虑项目的核心技术水平。针对项目的核心技术水平定量指标如图1所示。

经过细化形成的二级指标已经具备量化的可能，但是否需要继续针对二级指标继续进行细化，这是由不同二级指标的性质决定的。下面根据二级指标的性质完成指标细化。

①专利。项目获得的专利个数在一定程度上可以证明其创新性，但项目拥有的专利又具有各自不同的属性，例如：涉外专利所代表的创新性程度显然比国内专利要高，发明专利所代表的`创新性程度要比实用新型专利和外观设计专利要高，获奖专利要比未获奖专利的创新性程度要高。从这方面考虑必须对专利这一指标进行三级四级甚至五级指标的细化。

②技术标准。与专利情况相同，技术标准的不同属性也会代表不同的技术创新程度，所以针对技术标准进行下一级的指标细化也同样重要。其细化结果如图2所示。

③软件著作权、论著与专利和技术标准不同，软件著作权、论著没有等级重要性的划分，所以对二级指标进行量化就足以体现其创新程度。

2.3 评价指标权重确定

权值的确定是指标综合评价中的一个重要因素，也是影响系统评估结果合理性的重要因素之一。在众多的权重确定方法中，本模型采用区间打分法，即借助定量打分直接评分确定权重。由于科技进步奖涉及的项目类型众多，不同类型的项目其侧重点有所不同，因此为了使评价体系即合理又不会计算繁琐，对指标进行量化时，考虑一级指标、二级指标与末级指标的量化。

仍以技术开发类项目为例，将一级指标(技术创新程度、推动电力科技进步、技术经济指标先进度、技术创新对提高市场竞争能力的作用、经济效益或社会效益以及安全效益)作为因素集，设为V1={v1，v2，v3，v4，v5}，A1=(a1，a2，a3，a4，a5)为V中各因素权重系数集，且满足a1+a2+a3+a4+a5=1，ai根据各因素重要程度分配。例如，对于技术开发类项目来说，更侧重于技术创新度，推动电力科技进步的重要性相对较低，故可设置各一级指标的权重系数为{0.25，0.20，0.20，0.20，0.15}，对二级、三级指标也可同理设置。而末级指标则根据数量的多少给予分数，并且设定最高分数，当某一项目的某一项指标所得分数超过既定最高分数，则给予这项指标既定最高分，保证所有指标的分数不超过既定最高分。最终根据此细化和量化后的指标模型，进行计算机实现。

3 结语

此评价模型在一定程度上完善了国家电网公司原有的科技成果评价模式，减弱了评价人的主观影响。而且此模型体现智能的特点，计算机自动给出评价结果，使操作更加简单。未来可以研究更加客观有效的方法来确定指标权重，并通过积累大量历史数据改善评价模型，使得评价模型能够更加全面地促进和支撑重大成果的创新性，提升国家电网公司的整体创新能力。

数据挖掘

题目：数据挖掘技术在神经根型颈椎病方剂研究中的优势及应用进展

关键词：数据挖掘技术; 神经根型颈椎病; 方剂; 综述;

1 数据挖掘技术简介

数据挖掘技术[1] (Knowledge Discovery in Datebase, KKD) , 是一种新兴的信息处理技术, 它融汇了人工智能、模式别、模糊数学、数据库、数理统计等多种技术方法, 专门用于海量数据的处理, 从大量的、不完全的、有噪声的、模糊的、随机的数据集中, 提取隐含在其中的、人们事先不知道的、但又是潜在的有用的信息和知识, 其目的是发现规律而不是验证假设。数据挖掘技术主要适用于庞大的数据库的研究, 其特点在于:基于数据分析方法角度的分类, 其本质属于观察性研究, 数据来源于日常诊疗工作

2 数据挖掘术在神经根型颈椎病治方研究中的优势

中医对于神经根型颈椎病的治疗准则为辨证论治, 从古至今神经根型颈椎病的中医证型有很多, 其治方是集中医之理、法、方、药为一体的数据集合, 具有以“方-药-证”为核心的多维结构。方剂配伍本质上表现为方与方、方与药、药与药、药与剂量, 以及方药与证、病、症交叉错综的关联与对应[5], 而中医方剂讲究君臣佐使的配伍, 药物有升降沉浮, 四气五味及归经之别, 对于神经根型颈椎病的治疗, 治方中药物的种类、炮制方法、用量、用法等都是千变万化的, 而这些海量、模糊、看似随机的药物背后隐藏着对临床有用的信息和规律, 但这些大数据是无法在可承受的时间范围内可用常规软件工具进行捕捉、管理和处理的, 是需要一个新处理模式才能具有更强的决策力、洞察力和流程优化能力, 而数据挖掘技术有可能从这些海量的的数据中发现新知识, 揭示背后隐藏的关系和规则, 并且对未知的情况进行预测[6]。再者, 中医辨治充满非线性思维, “方-药-证”间的多层关联、序列组合、集群对应, 形成了整体论的思维方式和原则, 而数据挖掘技术数据挖掘在技术线路上与传统数据处理方法不同在于其能对数据库内的数据以线性和非线性方式解析, 尤善处理模糊的、非量化的数据。例如赵睿曦等[7]在研究张氏骨伤治疗腰椎间盘突出症的用药规律时, 选取了100张治方, 因该病病因病机复杂, 证候不一, 骨伤名师张玉柱先生对该病的治则治法、药物使用是不同的。因此他们利用Excel建立方证数据库, 采用SPPS Clementine12.0软件对这些数据的用药频次、药物关联规则及药物聚类进行分析, 最后总结出张氏骨伤治疗腰椎间盘突出症遵循病从肝治、病从血治、标本兼治的原则, 也归纳出治疗三种不同证型的腰突症的三类自拟方。由此看出数据挖掘技术在方剂研究中的应用对数据背后信息、规律等的挖掘及名家经验的推广具有重大意义, 因此数据挖掘技术在神经根型颈椎病的治方研究中也同样发挥着巨大的作用。

3 数据挖掘技术在神经根型颈椎治方中的应用进展

神经根型颈椎病在所有颈椎病中最常见, 约占50%~60%[8], 医家对其治方的研究也是不计其数。近年来数据挖掘技术也被运用于其治方研究中, 笔者通过万方、中国知网等总共检索出以下几篇文献, 虽数量不多但其优势明显。刘向前等[9]在挖掘古方治疗神经根型颈椎病的用药规律时, 通过检索《中华医典》并从中筛选以治疗颈项肩臂痛为主的古方219首并建立数据库, 对不同证治古方的用药类别、总味数、单味药使用频数及药对 (组) 出现频数进行统计, 总结出风寒湿痹证、痰湿阻痹证、寒湿阻滞证、正虚不足证的用药特点, 得出解表药、祛风湿药、活血化瘀药、补虚药是治疗颈项肩臂痛古方组成的主要药物。古为今用, 该研究对于现代医家在治疗该病中有很好的借鉴和参考意义。齐兵献等[10]检索CNKI (1980-2009年) 相关文献中治疗神经根型颈椎病的方剂建立数据库, 采用SPSS11.5统计软件这些治方常用药物使用频次频率、性味频率、归经频率分析比较, 治疗神经根型颈椎病的中药共计99味, 使用频次479味次;所用药物种类依次以补益药、活血化瘀药、祛风湿药运用最多, 其中药味以辛、苦为主, 药性以温、寒为主, 归经以肝、脾、心为主, 而本病以肝肾亏虚, 气血瘀滞为主, 临床以补益药、活血化瘀药、祛风湿药等中药运用最多。这对于医家治疗该病选用药物的性味、归经等具有指导意义。陈元川等[11]检索2004年1月至2013年3月发表的以单纯口服中药治疗神经根型颈椎病的有关文献, 对其中的方剂和药物进行统计、归类、分析, 最终纳入32首方剂, 涉及111味中药, 补气药、发散风寒药、活血止痛药、补血药等使用频次较高;葛根、白芍、黄芪、当归、桂枝等药物使用频次较高, 证实与古方桂枝加葛根汤主药相同, 且该方扶阳解表的治法与该研究得出的扶正祛邪的结果相吻合, 同时也证实石氏伤科强调治伤科病当“以气为主, 以血为先”等正确性。所以大数据背后的规律和关系在很多方面古今是一致的, 同时数据依据的支持也为现代神经根型颈椎病治疗提供有力的保障。谢辉等[12]收集2009至2014年10月3日的166张治疗神经根型颈椎病的治方建立数据库, 采用关联规则算法、复杂系统熵聚类等无监督数据挖掘方法, 利用中医传承辅助平台 (TCMISS) 软件分析处方中各种药物的使用频次、药物之间的关联规则、核心药物组合和新处方, 从中挖掘出治疗该病中医中的常用药物、药对, 阐明了治疗该病以解肌散寒药、补气活血药、祛风胜湿药和温经通络药为主, 治法主要包括解肌舒筋、益气活血和补益肝肾, 这一方面很清晰明了地展示了药物使用频率、药物之间的联系, 证实其与很多古代经典中治疗神经根型颈椎病的治则、治法及用药规律是吻合的, 是临床用药的积累和升华, 可有效地指导临床并提高疗效;另一方面也为中药新药的创制提供处方来源, 指导新药研发[13]。

4 小结

数据挖掘技术作为一种新型的研究技术, 在神经根型颈椎病的治方研究中的运用相对于其他领域是偏少的, 并且基本上是研究文献资料上出现的治方, 在对名老中医个人治疗经验及用药规律的总结是缺乏的, 因此研究范围广而缺乏针对性, 同时使用该技术的相关软件种类往往是单一的。现在研究者在研究中医方剂时往往采用传统的研究方法, 这就导致在大数据的研究中耗时、耗力甚则无能为力, 同样也难以精准地提取大数据背后的隐藏的潜在关系和规则及缺乏对未知情况的预测。产生这样的现状, 一方面是很多研究者尚未清楚该技术在方剂研究中的优势所在, 思维模式尚未更新;另一方面是很多研究者尚未清楚该技术的操作技能及软件种类及其应用范围。故以后应向更多研究者普及该技术的软件种类、其中的优势及操作技能, 让该技术在临床中使用更广, 产生更大的效益。

参考文献

[1]舒正渝.浅谈数据挖掘技术及应用[J].中国西部科技, 2010, 9 (5) :38-39.

[2]曹毅, 季聪华.临床科研设计与分析[M].杭州:浙江科学技术出版社, 2015:189.

[3]王静, 崔蒙.数据挖掘技术在中医方剂学研究中的应用[J].中国中医药信息杂志, 2008, 15 (3) :103-104.

[4]陈丈伟.数据仓库与数据挖掘[M].北京:清华大学出版社, 2006:5.

[5]杨玉珠.数据挖掘技术综述与应用[J].河南科技, 2014, 10 (19) :21.

[6]余侃侃.数据挖掘技术在方剂配伍中的研究现状及研究方法[J].中国医药指南, 2008, 6 (24) :310-312.

[7]赵睿曦.方证数据挖掘分析张氏骨伤对腰椎间盘突出症的辨证用药规律[J].陕西中医药大学学报, 2016, 39 (6) :44-46.

[8]李曙明, 尹战海, 王莹.神经根型颈椎病的影像学特点和分型[J].中国矫形外科杂志, 2013, 21 (1) :7-11.

[9]刘向前, 陈民, 黄广平等.颈项肩臂痛内治古方常用药物的统计分析[J].中华中医药学刊, 2012, 30 (9) :42-44.

[10]齐兵献, 樊成虎, 李兆和.神经根型颈椎病中医用药规律的文献研究[J].河南中医, 2012, 32 (4) :518-519.

[11]陈元川, 王翔, 庞坚, 等.单纯口服中药治疗神经根型颈椎病用药分析[J].上海中医药杂志, 2014, 48 (6) :78-80.

[12]谢辉, 刘军, 潘建科, 等.基于数据挖掘方法的神经根型颈椎病用药规律研究[J].世界中西医结合杂志, 2015, 10 (6) :849-852.

[13]唐仕欢, 杨洪军.中医组方用药规律研究进展述评[J].中国实验方剂学杂志, 2013 (5) :359-363.

数据挖掘论文二：

题目：大数据挖掘在智游应用中的探究

摘要：大数据和智游都是当下的热点, 没有大数据的智游无从谈“智慧”, 数据挖掘是大数据应用于智游的核心, 文章探究了在智游应用中, 目前大数据挖掘存在的几个问题。

关键词：大数据; 智游; 数据挖掘;

1引言

随着人民生活水平的进一步提高, 旅游消费的需求进一步上升, 在云计算、互联网、物联网以及移动智能终端等信息通讯技术的飞速发展下, 智游应运而生。大数据作为当下的热点已经成了智游发展的有力支撑, 没有大数据提供的有利信息, 智游无法变得“智慧”。

2大数据与智游

旅游业是信息密、综合性强、信息依存度高的产业[1], 这让其与大数据自然产生了交汇。2010年, 江苏省镇江市首先提出“智游”的概念, 虽然至今国内外对于智游还没有一个统一的学术定义, 但在与大数据相关的描述中, 有学者从大数据挖掘在智游中的作用出发, 把智游描述为:通过充分收集和管理所有类型和来源的旅游数据, 并深入挖掘这些数据的潜在重要价值信息, 然后利用这些信息为相关部门或对象提供服务[2]。这一定义充分肯定了在发展智游中, 大数据挖掘所起的至关重要的作用, 指出了在智游的过程中, 数据的收集、储存、管理都是为数据挖掘服务, 智游最终所需要的是利用挖掘所得的有用信息。

3大数据挖掘在智游中存在的问题

2011年, 我国提出用十年时间基本实现智游的目标[3], 过去几年, 国家旅游局的相关动作均为了实现这一目标。但是, 在借助大数据推动智游的可持续性发展中, 大数据所产生的价值却亟待提高, 原因之一就是在收集、储存了大量数据后, 对它们深入挖掘不够, 没有发掘出数据更多的价值。

3.1 信息化建设

智游的发展离不开移动网络、物联网、云平台。随着大数据的不断发展, 国内许多景区已经实现Wi-Fi覆盖, 部分景区也已实现人与人、人与物、人与景点之间的实时互动, 多省市已建有旅游产业监测平台或旅游大数据中心以及数据可视化平台, 从中进行数据统计、行为分析、监控预警、服务质量监督等。通过这些平台, 已基本能掌握跟游客和景点相关的数据, 可以实现更好旅游监控、产业宏观监控, 对该地的旅游管理和推广都能发挥重要作用。

但从智慧化的发展来看, 我国的信息化建设还需加强。虽然通讯网络已基本能保证, 但是大部分景区还无法实现对景区全面、透彻、及时的感知, 更为困难的是对平台的建设。在数据共享平台的建设上, 除了必备的硬件设施, 大数据实验平台还涉及大量部门, 如政府管理部门、气象部门、交通、电子商务、旅行社、旅游网站等。如此多的部门相关联, 要想建立一个完整全面的大数据实验平台, 难度可想而知。

3.2 大数据挖掘方法

大数据时代缺的不是数据, 而是方法。大数据在旅游行业的应用前景非常广阔, 但是面对大量的数据, 不懂如何收集有用的数据、不懂如何对数据进行挖掘和利用, 那么“大数据”犹如矿山之中的废石。旅游行业所涉及的结构化与非结构化数据, 通过云计算技术, 对数据的收集、存储都较为容易, 但对数据的挖掘分析则还在不断探索中。大数据的挖掘常用的方法有关联分析, 相似度分析, 距离分析, 聚类分析等等, 这些方法从不同的角度对数据进行挖掘。其中, 相关性分析方法通过关联多个数据来源, 挖掘数据价值。但针对旅游数据, 采用这些方法挖掘数据的价值信息, 难度也很大, 因为旅游数据中冗余数据很多, 数据存在形式很复杂。在旅游非结构化数据中, 一张图片、一个天气变化、一次舆情评价等都将会对游客的旅行计划带来影响。对这些数据完全挖掘分析, 对游客“行前、行中、行后”大数据的实时性挖掘都是很大的挑战。

3.3 数据安全

2017年, 数据安全事件屡见不鲜, 伴着大数据而来的数据安全问题日益凸显出来。在大数据时代, 无处不在的数据收集技术使我们的个人信息在所关联的数据中心留下痕迹, 如何保证这些信息被合法合理使用, 让数据“可用不可见”[4], 这是亟待解决的问题。同时, 在大数据资源的开放性和共享性下, 个人隐私和公民权益受到严重威胁。这一矛盾的存在使数据共享程度与数据挖掘程度成反比。此外, 经过大数据技术的分析、挖掘, 个人隐私更易被发现和暴露, 从而可能引发一系列社会问题。

大数据背景下的旅游数据当然也避免不了数据的安全问题。如果游客“吃、住、行、游、娱、购”的数据被放入数据库, 被完全共享、挖掘、分析, 那游客的人身财产安全将会受到严重影响, 最终降低旅游体验。所以, 数据的安全管理是进行大数据挖掘的前提。

3.4 大数据人才

大数据背景下的智游离不开人才的创新活动及技术支持, 然而与专业相衔接的大数据人才培养未能及时跟上行业需求, 加之创新型人才的外流, 以及数据统计未来3~5年大数据行业将面临全球性的人才荒, 国内智游的构建还缺乏大量人才。

4解决思路

在信息化建设上, 加大政府投入, 加强基础设施建设, 整合结构化数据, 抓取非结构化数据, 打通各数据壁垒, 建设旅游大数据实验平台;在挖掘方法上, 对旅游大数据实时性数据的挖掘应该被放在重要位置;在数据安全上, 从加强大数据安全立法、监管执法及强化技术手段建设等几个方面着手, 提升大数据环境下数据安全保护水平。加强人才的培养与引进, 加强产学研合作, 培养智游大数据人才。

参考文献

[1]翁凯.大数据在智游中的应用研究[J].信息技术, 2015, 24:86-87.

[2]梁昌勇, 马银超, 路彩虹.大数据挖掘, 智游的核心[J].开发研究, 2015, 5 (180) :134-139.

[3]张建涛, 王洋, 刘力刚.大数据背景下智游应用模型体系构建[J].企业经济, 2017, 5 (441) :116-123.

[4]王竹欣, 陈湉.保障大数据, 从哪里入手?[N].人民邮电究, 2017-11-30.

数据挖掘论文三：

题目：档案信息管理系统中的计算机数据挖掘技术探讨

摘要：伴随着计算机技术的不断进步和发展, 数据挖掘技术成为数据处理工作中的重点技术, 能借助相关算法搜索相关信息, 在节省人力资本的同时, 提高数据检索的实际效率, 基于此, 被广泛应用在数据密集型行业中。笔者简要分析了计算机数据挖掘技术, 并集中阐释了档案信息管理系统计算机数据仓库的建立和技术实现过程, 以供参考。

关键词：档案信息管理系统; 计算机; 数据挖掘技术; 1 数据挖掘技术概述

数据挖掘技术就是指在大量随机数据中提取隐含信息, 并且将其整合后应用在知识处理体系的技术过程。若是从技术层面判定数据挖掘技术, 则需要将其划分在商业数据处理技术中, 整合商业数据提取和转化机制, 并且建构更加系统化的分析模型和处理机制, 从根本上优化商业决策。借助数据挖掘技术能建构完整的数据仓库, 满足集成性、时变性以及非易失性等需求, 整和数据处理和冗余参数, 确保技术框架结构的完整性。

目前, 数据挖掘技术常用的工具, 如SAS企业的Enterprise Miner、IBM企业的Intellient Miner以及SPSS企业的Clementine等应用都十分广泛。企业在实际工作过程中, 往往会利用数据源和数据预处理工具进行数据定型和更新管理, 并且应用聚类分析模块、决策树分析模块以及关联分析算法等, 借助数据挖掘技术对相关数据进行处理。

2 档案信息管理系统计算机数据仓库的建立

2.1 客户需求单元

为了充分发挥档案信息管理系统的优势, 要结合客户的实际需求建立完整的处理框架体系。在数据库体系建立中, 要适应迭代式处理特征, 并且从用户需求出发整合数据模型, 保证其建立过程能按照整体规划有序进行, 且能按照目标和分析框架参数完成操作。首先, 要确立基础性的数据仓库对象, 由于是档案信息管理, 因此, 要集中划分档案数据分析的主题, 并且有效录入档案信息, 确保满足档案的数据分析需求。其次, 要对日常工作中的用户数据进行集中的挖掘处理, 从根本上提高数据仓库分析的完整性。

(1) 确定数据仓库的基础性用户, 其中, 主要包括档案工作人员和使用人员, 结合不同人员的工作需求建立相应的数据仓库。

(2) 档案工作要利用数据分析和档案用户特征分析进行分类描述。

(3) 确定档案的基础性分类主题, 一般而言, 要将文书档案归档情况、卷数等基础性信息作为分类依据。

2.2 数据库设计单元

在设计过程中, 要针对不同维度建立相应的参数体系和组成结构, 并且有效整合组成事实表的主键项目, 建立框架结构。

第一, 建立事实表。事实表是数据模型的核心单元, 主要是记录相关业务和统计数据的表, 能整合数据仓库中的信息单元, 并且提升多维空间处理效果, 确保数据储存过程切实有效。 (1) 档案管理中文书档案目录卷数事实表:事实表主键, 字段类型Int, 字段为Id;文书归档年份, 字段类型Int, 字段为Gdyear_key;文书归档类型, 字段类型Int, 字段为Ajtm_key;文书归档单位, 字段类型Int, 字段为Gddw_key;文书档案生成年份, 字段类型Int, 字段为Ajscsj_key, 以及文书档案包括的文件数目。 (2) 档案管理中文书档案卷数事实表:事实表主键, 字段类型Int, 字段为Id;文书归档利用日期, 字段类型Int, 字段为Date_key;文书归档利用单位, 字段类型Int, 字段为Dw_key;文书归档利用类别, 字段类型Int, 字段为Dalb_key;文书归档利用年份, 字段类型Int, 字段为Dayear_key等[1]。

第二, 建立维度表, 在实际数据仓库建立和运维工作中, 提高数据管理效果和水平, 确保建立循环和反馈的系统框架体系, 并且处理增长过程和完善过程, 有效实现数据库模型设计以及相关维护操作。首先, 要对模式的基础性维度进行分析并且制作相应的表, 主要包括档案年度维表、利用方式维表等。其次, 要建构数据库星型模型体系。最后, 要集中判定数据库工具, 保证数据库平台在客户管理工作方面具备一定的优势, 集中制订商务智能解决方案, 保证集成环境的稳定性和数据仓库建模的效果, 真正提高数据抽取以及转换工作的实际水平。需要注意的是, 在全面整合和分析处理数据的过程中, 要分离文书档案中的数据, 相关操作如下:

from dag gd temp//删除临时表中的数据

Ch count=dag 1.importfile (dbo.u wswj) //将文书目录中数据导出到数据窗口

Dag 1.() //将数据窗口中的数据保存到临时表

相关技术人员要对数据进行有效处理, 以保证相关数据合并操作、连接操作以及条件性拆分操作等都能按照数据预处理管理要求合理化进行, 从根本上维护数据处理效果。

2.3 多维数据模型建立单元

在档案多维数据模型建立的过程中, 相关技术人员要判定联机分析处理项目和数据挖掘方案, 整合信息系统中的数据源、数据视图、维度参数以及属性参数等, 保证具体单元能发挥其实际作用, 并且真正发挥档案维表的稳定性、安全性优势。

第一, 档案事实表中的数据稳定, 事实表是加载和处理档案数据的基本模块, 按照档案目录数据表和档案利用情况表分析和判定其类别和归档时间, 从而提高数据独立分析水平。一方面, 能追加有效的数据, 保证数据仓库信息的基本质量, 也能追加时间判定标准, 能在实际操作中减少扫描整个表浪费的时间, 从根本上提高实际效率。另一方面, 能删除数据, 实现数据更新, 检索相关关键词即可。并且也能同时修改数据, 维护档案撤出和档案追加的动态化处理效果。

第二, 档案维表的安全性。在维表管理工作中, 档案参数和数据的安全稳定性十分关键, 由于其不会随着时间的推移出现变化, 因此, 要对其进行合理的处理和协调。维表本身的存储空间较小, 尽管结构发生变化的概率不大, 但仍会对代表的对象产生影响, 这就会使得数据出现动态的变化。对于这种改变, 需要借助新维生成的方式进行处理, 从而保证不同维表能有效连接, 整合正确数据的同时, 也能对事实表外键进行分析[2]。

3 档案信息管理系统计算机数据仓库的实现

3.1 描述需求

随着互联网技术和数据库技术不断进步, 要提高档案数字化水平以及完善信息化整合机制, 加快数据库管控体系的更新, 确保设备存储以及网络环境一体化水平能满足需求, 尤其是在档案资源重组和预测项目中, 只有从根本上落实数据挖掘体系, 才能为后续信息档案管理项目升级奠定坚实基础。另外, 在数据表和文书等基础性数据结构模型建立的基础上, 要按照规律制定具有个性化的主动性服务机制。

3.2 关联计算

在实际档案分析工作开展过程中, 关联算法描述十分关键, 能对某些行为特征进行统筹整合, 从而制定分析决策。在进行关联规则强度分析时, 要结合支持度和置信度等系统化数据进行综合衡量。例如, 档案数据库中有A和B两个基础项集合, 支持度为P (A∪B) , 则直接表述了A和B在同一时间出现的基础性概率。若是两者出现的概率并不大, 则证明两者之间的关联度较低。若是两者出现的概率较大, 则说明两者的关联度较高。另外, 在分析置信度时, 利用Confidence (A→B) = (A|B) , 也能有效判定两者之间的关系。在出现置信度A的情况下, B的出现概率则是整体参数关系的关键, 若是置信度的数值达到100%, 则直接证明A和B能同一时间出现。

3.3 神经网络算法

除了要对档案的实际内容进行数据分析和数据库建构, 也要对其利用情况进行判定, 目前较为常见的利用率分析算法就是神经网络算法, 其借助数据分类系统判定和分析数据对象。值得注意的是, 在分类技术结构中, 要结合训练数据集判定分类模型数据挖掘结构。神经网络算法类似于人脑系统的运行结构, 能建立完整的信息处理单元, 并且能够整合非线性交换结构, 确保能凭借历史数据对计算模型和分类体系展开深度分析[3]。

3.4 实现多元化应用

在档案管理工作中应用计算机数据挖掘技术, 能对档案分类管理予以分析, 保证信息需求分类总结工作的完整程度。尤其是档案使用者在对档案具体特征进行差异化分析的过程中, 能结合不同的元素对具体问题展开深度调研。一方面, 计算机数据挖掘技术借助决策树算法处理规则化的档案分析机制。在差异化训练体系中, 要对数据集合中的数据进行系统化分析以及处理, 确保构建要求能适应数据挖掘的基本结构[4]。例如, 档案管理人员借助数据挖掘技术能整合档案使用人员长期浏览与关注的信息, 并且能集中收集和汇总间隔时间、信息查询停留时间等, 从而建构完整的数据分析机制, 有效向其推送或者是提供便捷化查询服务, 保证档案管理数字化水平的提高。另一方面, 在档案收集管理工作中应用数据挖掘技术, 主要是对数据信息进行分析, 结合基本结果建立概念模型, 保证模型以及测试样本之间的比较参数符合标准, 从而真正建立更加系统化的分类框架体系。

4 结语

总而言之, 在档案管理工作中应用数据挖掘技术, 能在准确判定用户需求的同时, 维护数据处理效果, 并且减少档案数字化的成本, 为后续工作的进一步优化奠定坚实基础。并且, 数据库的建立, 也能节省经费和设备维护成本, 真正实现数字化全面发展的目标, 促进档案信息管理工作的长效进步。

参考文献

[1]曾雪峰.计算机数据挖掘技术开发及其在档案信息管理中的运用研究[J].科技创新与应用, 2016 (9) :285.

[2]王晓燕.数据挖掘技术在档案信息管理中的应用[J].兰台世界, 2014 (23) :25-26.

[3]韩吉义.基于数据挖掘技术的高校图书馆档案信息管理平台的构筑[J].山西档案, 2015 (6) :61-63.

[4]哈立原.基于数据挖掘技术的高校图书馆档案信息管理平台构建[J].山西档案, 2016 (5) :105-107.

数据挖掘论文四：题目：机器学习算法在数据挖掘中的应用

摘要：随着科学技术的快速发展, 各种新鲜的事物和理念得到了广泛的应用。其中机器学习算法就是一则典型案例——作为一种新型的算法, 其广泛应用于各行各业之中。本篇论文旨在探讨机器学习算法在数据挖掘中的具体应用, 我们利用庞大的移动终端数据网络, 加强了基于GSM网络的户外终端定位, 从而提出了3个阶段的定位算法, 有效提高了定位的精准度和速度。

关键词：学习算法; GSM网络; 定位; 数据;

移动终端定位技术由来已久, 其主要是利用各种科学技术手段定位移动物体的精准位置以及高度。目前, 移动终端定位技术主要应用于军事定位、紧急救援、网络优化、地图导航等多个现代化的领域, 由于移动终端定位技术可以提供精准的位置服务信息, 所以其在市场上还是有较大的需求的, 这也为移动终端定位技术的优化和发展, 提供了推动力。随着通信网络普及, 移动终端定位技术的发展也得到了一些帮助, 使得其定位的精准度和速度都得到了全面的优化和提升。同时, 传统的定位方法结合先进的算法来进行精准定位, 目前依旧还是有较大的进步空间。在工作中我选取机器学习算法结合数据挖掘技术对传统定位技术加以改进, 取得了不错的效果, 但也遇到了许多问题, 例如:使用机器学习算法来进行精准定位暂时无法满足更大的区域要求, 还有想要利用较低的设备成本, 实现得到更多的精准定位的要求比较困难。所以本文对机器学习算法进行了深入的研究, 希望能够帮助其更快速的定位、更精准的定位, 满足市场的需要。

1 数据挖掘概述

数据挖掘又名数据探勘、信息挖掘。它是数据库知识筛选中非常重要的一步。数据挖掘其实指的就是在大量的数据中通过算法找到有用信息的行为。一般情况下, 数据挖掘都会和计算机科学紧密联系在一起, 通过统计集合、在线剖析、检索筛选、机器学习、参数识别等多种方法来实现最初的目标。统计算法和机器学习算法是数据挖掘算法里面应用得比较广泛的两类。统计算法依赖于概率分析, 然后进行相关性判断, 由此来执行运算。

而机器学习算法主要依靠人工智能科技, 通过大量的样本收集、学习和训练, 可以自动匹配运算所需的相关参数及模式。它综合了数学、物理学、自动化和计算机科学等多种学习理论, 虽然能够应用的领域和目标各不相同, 但是这些算法都可以被独立使用运算, 当然也可以相互帮助, 综合应用, 可以说是一种可以“因时而变”、“因事而变”的算法。在机器学习算法的领域, 人工神经网络是比较重要和常见的一种。因为它的优秀的数据处理和演练、学习的能力较强。

而且对于问题数据还可以进行精准的识别与处理分析, 所以应用的频次更多。人工神经网络依赖于多种多样的建模模型来进行工作, 由此来满足不同的数据需求。综合来看, 人工神经网络的建模, 它的精准度比较高, 综合表述能力优秀, 而且在应用的过程中, 不需要依赖专家的辅助力量, 虽然仍有缺陷, 比如在训练数据的时候耗时较多, 知识的理解能力还没有达到智能化的标准, 但是, 相对于其他方式而言, 人工神经网络的优势依旧是比较突出的。

2 以机器学习算法为基础的GSM网络定位

2.1 定位问题的建模

建模的过程主要是以支持向量机定位方式作为基础, 把定位的位置栅格化, 面积较小的栅格位置就是独立的一种类别, 在定位的位置内, 我们收集数目庞大的终端测量数据, 然后利用计算机对测量报告进行分析处理, 测量栅格的距离度量和精准度, 然后对移动终端栅格进行预估判断, 最终利用机器学习进行分析求解。

2.2 采集数据和预处理

本次研究, 我们采用的模型对象是我国某一个周边长达10千米的二线城市。在该城市区域内, 我们测量了四个不同时间段内的数据, 为了保证机器学习算法定位的精准性和有效性, 我们把其中的三批数据作为训练数据, 最后一组数据作为定位数据, 然后把定位数据周边十米内的前三组训练数据的相关信息进行清除。一旦确定某一待定位数据, 就要在不同的时间内进行测量, 按照测量出的数据信息的经纬度和平均值, 再进行换算, 最终, 得到真实的数据量, 提升定位的速度以及有效程度。

2.3 以基站的经纬度为基础的初步定位

用机器学习算法来进行移动终端定位, 其复杂性也是比较大的, 一旦区域面积增加, 那么模型和分类也相应增加, 而且更加复杂, 所以, 利用机器学习算法来进行移动终端定位的过程, 会随着定位区域面积的增大, 而耗费更多的时间。利用基站的经纬度作为基础来进行早期的定位, 则需要以下几个步骤:要将边长为十千米的正方形分割成一千米的小栅格, 如果想要定位数据集内的相关信息, 就要选择对边长是一千米的小栅格进行计算, 而如果是想要获得边长一千米的大栅格, 就要对边长是一千米的栅格精心计算。

2.4 以向量机为基础的二次定位

在完成初步定位工作后, 要确定一个边长为两千米的正方形, 由于第一级支持向量机定位的区域是四百米, 定位输出的是以一百米栅格作为中心点的经纬度数据信息, 相对于一级向量机的定位而言, 二级向量机在定位计算的时候难度是较低的`, 更加简便。后期的预算主要依赖决策函数计算和样本向量机计算。随着栅格的变小, 定位的精准度将越来越高, 而由于增加分类的问题数量是上升的, 所以, 定位的复杂度也是相对增加的。

2.5 以K-近邻法为基础的三次定位

第一步要做的就是选定需要定位的区域面积, 在二次输出之后, 确定其经纬度, 然后依赖经纬度来确定边长面积, 这些都是进行区域定位的基础性工作, 紧接着就是定位模型的训练。以K-近邻法为基础的三次定位需要的是综合训练信息数据, 对于这些信息数据, 要以大小为选择依据进行筛选和合并, 这样就能够减少计算的重复性。当然了, 选择的区域面积越大, 其定位的速度和精准性也就越低。

3 结语

近年来, 随着我国科学技术的不断发展和进步, 数据挖掘技术愈加重要。根据上面的研究, 我们证明了, 在数据挖掘的过程中, 应用机器学习算法具有举足轻重的作用。作为一门多领域互相交叉的知识学科, 它能够帮助我们提升定位的精准度以及定位速度, 可以被广泛的应用于各行各业。所以, 对于机器学习算法, 相关人员要加以重视, 不断的进行改良以及改善, 切实的发挥其有利的方面, 将其广泛应用于智能定位的各个领域, 帮助我们解决关于户外移动终端的定位的问题。

参考文献

[1]陈小燕, CHENXiaoyan.机器学习算法在数据挖掘中的应用[J].现代电子技术, 2015, v.38;No.451 (20) :11-14.

[2]李运.机器学习算法在数据挖掘中的应用[D].北京邮电大学, 2014.

[3]莫雪峰.机器学习算法在数据挖掘中的应用[J].科教文汇, 2016 (07) :175-178.

数据挖掘论文五：题目：软件工程数据挖掘研究进展

摘要：数据挖掘是指在大数据中开发出有价值信息数据的过程。计算机技术的不断进步, 通过人工的方式进行软件的开发与维护难度较大。而数据挖掘能够有效的提升软件开发的效率, 并能够在大量的数据中获得有效的数据。文章主要探究软件工程中数据挖掘技术的任务和存在的问题, 并重点论述软件开发过程中出现的问题和相关的解决措施。

关键词：软件工程; 数据挖掘; 解决措施;

在软件开发过程中, 为了能够获得更加准确的数据资源, 软件的研发人员就需要搜集和整理数据。但是在大数据时代, 人工获取数据信息的难度极大。当前, 软件工程中运用最多的就是数据挖掘技术。软件挖掘技术是传统数据挖掘技术在软件工程方向的其中一部分。但是它具有自身的特征, 体现在以下三个方面:

(1) 在软件工程中, 对有效数据的挖掘和处理;

(2) 挖掘数据算法的选择问题;

(3) 软件的开发者该如何选择数据。

1 在软件工程中数据挖掘的主要任务

在数据挖掘技术中, 软件工程数据挖掘是其中之一, 其挖掘的过程与传统数据的挖掘无异。通常包括三个阶段:第一阶段, 数据的预处理;第二阶段, 数据的挖掘;第三阶段, 对结果的评估。第一阶段的主要任务有对数据的分类、对异常数据的检测以及整理和提取复杂信息等。虽然软件工程的数据挖掘和传统的数据挖掘存在相似性, 但是也存在一定的差异, 其主要体现在以下三个方面:

1.1 软件工程的数据更加复杂

软件工程数据主要包括两种, 一种是软件报告, 另外一种是软件的版本信息。当然还包括一些软件代码和注释在内的非结构化数据信息。这两种软件工程数据的算法是不同的, 但是两者之间又有一定的联系, 这也是软件工程数据挖掘复杂性的重要原因。

1.2 数据分析结果的表现更加特殊

传统的数据挖掘结果可以通过很多种结果展示出来, 最常见的有报表和文字的方式。但是对于软件工程的数据挖掘来讲, 它最主要的职能是给软件的研发人员提供更加精准的案例, 软件漏洞的实际定位以及设计构造方面的信息, 同时也包括数据挖掘的统计结果。所以这就要求软件工程的数据挖掘需要更加先进的结果提交方式和途径。

1.3 对数据挖掘结果难以达成一致的评价

我国传统的数据挖掘已经初步形成统一的评价标准, 而且评价体系相对成熟。但是软件工程的数据挖掘过程中, 研发人员需要更多复杂而又具体的数据信息, 所以数据的表示方法也相对多样化, 数据之间难以进行对比, 所以也就难以达成一致的评价标准和结果。不难看出, 软件工程数据挖掘的关键在于对挖掘数据的预处理和对数据结果的表示方法。

2 软件工程研发阶段出现的问题和解决措施

软件在研发阶段主要的任务是对软件运行程序的编写。以下是软件在编码和结果的提交过程中出现的问题和相应的解决措施。

2.1 对软件代码的编写过程

该过程需要软件的研发人员能够对自己需要编写的代码结构与功能有充分的了解和认识。并能够依据自身掌握的信息, 在数据库中搜集到可以使用的数据信息。通常情况下, 编程需要的数据信息可以分为三个方面:

(1) 软件的研发人员能够在已经存在的代码中搜集可以重新使用的代码;

(2) 软件的研发人员可以搜寻可以重用的静态规则, 比如继承关系等。

(3) 软件的开发人员搜寻可以重用的动态规则。

包括软件的接口调用顺序等。在寻找以上信息的过程中, 通常是利用软件的帮助文档、寻求外界帮助和搜集代码的方式实现, 但是以上方式在搜集信息过程中往往会遇到较多的问题, 比如:帮助文档的准确性较低, 同时不够完整, 可利用的重用信息不多等。

2.2 对软件代码的重用

在对软件代码重用过程中, 最关键的问题是软件的研发人员必须掌握需要的类或方法, 并能够通过与之有联系的代码实现代码的重用。但是这种方式哦足迹信息将会耗费工作人员大量的精力。而通过关键词在代码库中搜集可重用的软件代码, 同时按照代码的相关度对搜集到的代码进行排序, 该过程使用的原理就是可重用的代码必然模式基本类似, 最终所展现出来的搜索结果是以上下文结构的方式展现的。比如:类与类之间的联系。其实现的具体流程如下:

(1) 软件的开发人员创建同时具备例程和上下文架构的代码库;

(2) 软件的研发人员能够向代码库提供类的相关信息, 然后对反馈的结果进行评估, 创建新型的代码库。

(3) 未来的研发人员在搜集过程中能够按照评估结果的高低排序, 便于查询, 极大地缩减工作人员的任务量, 提升其工作效率。

2.3 对动态规则的重用

软件工程领域内对动态规则重用的研究已经相对成熟, 通过在编译器内安装特定插件的方式检验代码是否为动态规则最适用的, 并能够将不适合的规则反馈给软件的研发人员。其操作流程为:

(1) 软件的研发人员能够规定动态规则的顺序, 主要表现在:使用某一函数是不能够调用其他的函数。

(2) 实现对相关数据的保存, 可以通过队列等简单的数据结构完成。在利用编译拓展中检测其中的顺序。

(3) 能够将错误的信息反馈给软件的研发人员。

3 结束语

在软件工程的数据挖掘过程中, 数据挖掘的概念才逐步被定义, 但是所需要挖掘的数据是已经存在的。数据挖掘技术在软件工程中的运用能够降低研发人员的工作量, 同时软件工程与数据挖掘的结合是计算机技术必然的发展方向。从数据挖掘的过程来讲, 在其整个实施过程和周期中都包括软件工程。而对数据挖掘的技术手段来讲, 它在软件工程中的运用更加普遍。在对数据挖掘技术的研究过程中可以发现, 该技术虽然已经获得一定的效果, 但是还有更多未被挖掘的空间, 还需要进一步的研究和发现。

参考文献

[1]王艺蓉.试析面向软件工程数据挖掘的开发测试技术[J].电子技术与软件工程, 2017 (18) :64.

[2]吴彦博.软件工程中数据挖掘技术的运用探索[J].数字通信世界, 2017 (09) :187.

[3]周雨辰.数据挖掘技术在软件工程中的应用研究[J].电脑迷, 2017 (08) :27-28.

[4]刘桂林.分析软件工程中数据挖掘技术的应用方式[J].中国新通信, 2017, 19 (13) :119.